適合度の検定
適合度の検定--ポアソン分布への適合度の検定
例題:
「表 1 は,ある都市の交通事故件数のデータである。これに,ポアソン分布をあてはめ,適合度の検定をせよ。」
死亡者数 | 実測値 | 相対度数 | ポアソン分布 | ||
Xi | fi | fi/365 | f(X) | 期待度数 | |
0 | 27 | 0.074 | 0.050 | 18.322 | |
1 | 61 | 0.167 | 0.150 | 54.816 | |
2 | 77 | 0.211 | 0.225 | 81.999 | |
3 | 71 | 0.195 | 0.224 | 81.774 | |
4 | 54 | 0.148 | 0.168 | 61.163 | |
5 | 35 | 0.096 | 0.100 | 36.597 | |
6 | 20 | 0.055 | 0.050 | 18.248 | |
7 | 11 | 0.030 | 0.021 | 7.799 | |
8 | 6 | 0.016 | 0.008 | 2.917 | |
9 | 2 | 0.005 | 0.003 | 0.970 | |
10〜 | 1 | 0.003 | 0.001 | 0.395 | |
合計 | 365 | 1.000 | 1.000 | 365.000 |
注:母平均(ポアソン定数)が既知の場合には以下の方法ではなく,名義尺度の場合 または 順序尺度以上の場合(1 標本コルモゴロフスミルノフ検定)により検定を行う。
検定手順:
- 前提
- まず最初に,ポアソン分布のパラメータを推定する。
注:測定値の分布にポアソン分布をあてはめるときには一般に母平均がわからないので,以下のように標本値で代用しなければならない。
- n 個のケースが,k 個のカテゴリーに分類されているとする。
例題では,n = 365,k = 11 である。
- 与えられた度数分布表から,母平均(= 母分散)λ を推定する。
各階級の値を Xi(i=0,1,...,k-1),観測度数を fi とすれば,
例題では,標本平均 = (0・27+1・61+2・77+...+9・2+10・1) / 365 = 2.99178 となる。これを λ の推定値とする。
- n 個のケースが,k 個のカテゴリーに分類されているとする。
- 各カテゴリーの期待値は,
例題では,表 1 の 5 列目に計算結果を示す。
- 期待値が 1 以下のカテゴリーを併合する。併合後のカテゴリー数を m とする。
例題では,最後の 2 行をまとめる(死亡者数が 9 以上を一つのカテゴリーとする)。m = 10 になる。
- 以下の式で検定統計量を計算する。
例題では,χ20 = 14.143 となる。
- χ20 は,自由度が m-1-1 の χ2 分布に従う(母平均の推定を行ったため,自由度が 1 余分に減る)。
例題では,自由度は 8 である。
- 有意確率を P = Pr{χ2 ≧ χ20}とする。
χ2 分布表,または χ2 分布の上側確率の計算を参照すること。
例題では,自由度 8 の χ2 分布において,Pr{χ2 ≧ 15.51}= 0.05 であるから,P = Pr{χ2 ≧ 14.143}> 0.05 である(正確な有意確率:P = 0.078)。
- 帰無仮説の採否を決める。
例題では,有意水準 5% で検定を行うとすれば(α = 0.05),P > α であるから,帰無仮説を採択する。すなわち,「ポアソン分布に従っていないとはいえない」。
適合度の検定--名義尺度の場合
例題:
「サイコロを 56 回振って目の出方を調べたところ,表 1 のようになった。このサイコロは正しいサイコロといえるだろうか。」
出た目 | 1 | 2 | 3 | 4 | 5 | 6 | 合計 |
---|---|---|---|---|---|---|---|
度数 | 10 | 12 | 9 | 4 | 13 | 8 | 56 |
R による解析:
> chisq.test(c(10, 12, 9, 4, 13, 8)) Chi-squared test for given probabilities data: c(10, 12, 9, 4, 13, 8) X-squared = 5.5, df = 5, p-value = 0.3579自作のexact な検定関数によれば,計算時間がかかるが以下のような結果になる。
> gft(c(10, 12, 9, 4, 13, 8)) カイ二乗値は 5.5,自由度は 5,P値は 0.357946 正確なP値は 0.370005
適合度の検定--名義尺度の場合
例題:
「表 2 において,表現形質が 9:3:3:1 になっているかどうか検定しなさい。」
表現形質 | AA | Ab | aB | ab | 合計 |
---|---|---|---|---|---|
観察度数 | 29 | 12 | 8 | 2 | 51 |
R による解析:
> chisq.test(c(29, 12, 8, 2), p=c(9, 3, 3, 1)/16) Chi-squared test for given probabilities data: c(29, 12, 8, 2) X-squared = 1.3224, df = 3, p-value = 0.7238 Warning message: Chi-squared approximation may be incorrect in: chisq.test(c(29, 12, 8, 2), p = c(9, 3, 3, 1)/16)自作のexact な検定関数によれば,以下のような結果になる。
> gft(c(29, 12, 8, 2), p=c(9, 3, 3, 1)) カイ二乗値は 1.32244,自由度は 3,P値は 0.723811 正確なP値は 0.741471
適合度の検定--名義尺度の場合
例題:
「サイコロを 56 回振って目の出方を調べたところ,表 1 のようになった。このサイコロは正しいサイコロといえるだろうか。」
出た目 | 1 | 2 | 3 | 4 | 5 | 6 | 合計 |
---|---|---|---|---|---|---|---|
度数 | 10 | 12 | 9 | 4 | 13 | 8 | 56 |
検定手順:
- 前提
- 帰無仮説 H0:「各カテゴリーの理論比が pi(i=1,2,... ,k)である」。
- 対立仮説 H1:「各カテゴリーの理論比が pi(i=1,2,... ,k)ではない」。
- 有意水準 α で両側検定を行う(片側検定は定義できない)。
- n 個のケースが,k 個のカテゴリーに分類されているとする。
例題では,n = 56,k = 6 である。
- Oi: 第 i カテゴリーの観察値
例題では,O1 = 10,O2 = 12,... ,O6 = 8 である。
- Ei = n pi : 第 i カテゴリーの期待値
例題では,正しいサイコロならば,どの目の出る確率も等しく 1/6 であるはずである(p1 = p2 = ... = p6 = 1/6 )。
したがって,各目の出る期待値は,E1 = E2 = ... = E6 =56×(1/6) = 9.333 である。
- 期待値が 1 以下のカテゴリーを併合する。併合後のカテゴリー数を m とする。
例題では,このステップは不要である。
m = k = 6 である。
- 以下の式で検定統計量を計算する。
例題では,χ20 = [ (10-56/6)2+(12-56/6)2+ ... + (8-56/6)2 ] / (56/6) = 5.5 となる。
- χ20 は,自由度が m-1 の χ2 分布に従う。
例題では,自由度が 5 の χ2 分布に従う。
- 有意確率を P = Pr{χ2 ≧ χ20}とする。
χ2分布表,または χ2 分布の上側確率の計算を参照すること。
例題では,自由度 5 の χ2 分布において,Pr{χ2 ≧ 11.07}= 0.05 であるから,P = Pr{χ2 ≧ 5.5}> 0.05 である(正確な有意確率:P = 0.3579459)。
- 帰無仮説の採否を決める。
例題では,有意水準 5% で検定を行うとすれば(α = 0.05),P > α であるから,帰無仮説を採択する。すなわち,「サイコロの目の出方は等しくないとはいえない」。
注1:理論比が一定 pi(i=1,2,... ,k)の場合は,特に一様性の検定と呼ばれる。
注2:順序尺度データ以上の場合には,もっと適切な検定手法がある。
適合度の検定--正規分布への適合度の検定
例題:
「体重を測定した結果(測定精度は 0.1kg)が表 1 のようにまとめられた(表の左2列)。このデータは正規分布に従っているといえるだろうか。」
階級 | 度数 f | 下限点 | 上限点 | 級中心 x | f x | f x2 | z | F(z) | 理論比 | 期待値 |
---|---|---|---|---|---|---|---|---|---|---|
35〜 | 0 | 34.95 | 39.95 | 37.45 | 0.00 | 0.00 | -3.50 | 0.0002 | 0.0002 | 0.098 |
40〜 | 4 | 39.95 | 44.95 | 42.45 | 169.80 | 7208.01 | -2.53 | 0.0057 | 0.0055 | 2.340 |
45〜 | 19 | 44.95 | 49.95 | 47.45 | 901.55 | 42788.55 | -1.55 | 0.0600 | 0.0543 | 23.124 |
50〜 | 86 | 49.95 | 54.95 | 52.45 | 4510.70 | 236586.22 | -0.58 | 0.2807 | 0.2207 | 94.020 |
55〜 | 177 | 54.95 | 59.95 | 57.45 | 10168.65 | 534188.94 | 0.39 | 0.6529 | 0.3722 | 158.568 |
60〜 | 105 | 59.95 | 64.95 | 62.45 | 6557.25 | 409500.26 | 1.37 | 0.9142 | 0.2613 | 111.310 |
65〜 | 33 | 64.95 | 69.95 | 67.45 | 2225.85 | 150133.58 | 2.34 | 0.9904 | 0.0762 | 32.446 |
70〜 | 2 | 69.95 | 74.95 | 72.45 | 144.90 | 10498.01 | 3.32 | 0.9995 | 0.0092 | 3.899 |
75〜 | 0 | 74.95 | 79.95 | 77.45 | 0.00 | 0.00 | 4.29 | 1.0000 | 0.0005 | 0.195 |
合計 | 426 | 24678.70 | 1440893.57 | 1.0000 | 426.000 |
注:母平均,母分散が既知の場合には以下の方法ではなく,名義尺度の場合 または 順序尺度以上の場合(1 標本コルモゴロフスミルノフ検定)により検定を行う。
検定手順:
- 前提
- まず最初に,正規分布のパラメータを推定する。
注:測定値の分布に正規分布をあてはめるときには一般に母平均,母分散がわからないので,以下のように標本値で代用しなければならない。
- n 個のケースが,k 個のカテゴリーに分類されているとする。
例題では,n = 426,k = 9(階級「35〜」と「75〜」は以下の計算を行うために作られたものである)。
- 各階級の中心点を Xi,観測度数を fi とする。
例題では,測定精度が 0.1 kg なので,たとえば「50kg 以上 55kg 未満」という階級の真の限点は 49.95kg と 54.95kg である。級中心はその中点で,52.45kg である(50kg と 55kg の中点の 52.5kg ではないことに注意)。
図 1.限点・級中心の定義
- 与えられた度数分布表から,母平均と母分散の推定値 Mean,Variance を推定する。
例題では,表 1 の 6 列目の合計欄の 24678.70 を n = 426 で割って,Mean = 57.9312,7 列目の合計欄の 1440893.57 を用いて Variance = 26.3528。
- 第 i 階級と第 i+1 階級の限点を X'i,それに対する標準化得点を Zi とする。
例題では,表 1 の 8 列目。
- 各 Zi から Z < Zi となる確率 Pi を求め(標準正規分布表,または正規分布の上側確率の計算を参照する),差をとることにより各階級の確率 pi = Pi - Pi-1(i = 2,3,... ,k-1)を求める。
p1 = Pr{Z < Z1}
pk = 1 - ( p1 + p2 + ... + pk-1 )。
例題では,表 1 の 9,10 列目。
- n 個のケースが,k 個のカテゴリーに分類されているとする。
- 理論度数は,Ei = n pi となる。
例題では,表 1 の 11 列目。
図 2.あてはめ結果
- 期待値が 1 以下のカテゴリーを併合する。併合後のカテゴリー数を m とする。
例題では,表 1 の最初の 2 行を一つに合併し,最後の 2 行を一つに合併する。m = 7 である。
- 以下の式で検定統計量を計算する。
例題では,χ20 = 6.000 となる。
- χ20 は,自由度が m - 1 - 2 の χ2 分布に従う(母平均と母分散の推定を行ったため,自由度が 2 だけ余分に減る。)
例題では,自由度が 7 - 1 - 2 = 4 の χ2 分布に従うことになる。
- 有意確率を P = Pr{χ2 ≧ χ20}とする。
χ2 分布表,または χ2 分布の上側確率の計算を参照すること。
例題では,自由度 4 の χ2 分布において,Pr{χ2 ≧ 9.49}= 0.05 であるから,P = Pr{χ2 ≧ 6.000}> 0.05 である(正確な有意確率:P = 0.199)。
- 帰無仮説の採否を決める。
例題では,有意水準 5% で検定を行うとすれば(α = 0.05),P > α であるから,帰無仮説を採択する。すなわち,「正規分布に従っていないとはいえない」。
適合度の検定--順序尺度以上の場合
例題:
「テストの弁別力を高めるためには得点の分布が矩形であること(一様分布)が望ましいといわれる。つまり,各得点の度数(確率)が等しい方がよい。 表 1 はあるテストの得点の分布を示すものである。真の分布は矩形といえるか。すなわち,各得点の確率は等しいといえるか。」
得点(中心点) | 10 | 12 | 14 | 16 | 18 | 20 | 22 | 24 | 合計 |
---|---|---|---|---|---|---|---|---|---|
観察度数 | 10 | 13 | 16 | 13 | 6 | 7 | 7 | 8 | 80 |
R による解析:
> dosuu <- c(10, 13, 16, 13, 6, 7, 7, 8) > ks1(dosuu) # この関数の定義を見る $x [1] 10 13 16 13 6 7 7 8 $p # 実際に適用された母比率ベクトル [1] 0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125 $n [1] 80 $D [1] 0.15 $P [1] 0.04902089 # 正確な P 値
適合度の検定--順序尺度以上の場合
例題:
「24 人の患者にある薬剤を投与し,その効果を調べた結果は,表 2 のようになった。治療効果を検討するために,各患者の効果判定が一様に分布するかどうかを検定したい。」
判定 | 悪化 | 不変 | やや改善 | 改善 | 非常に改善 | 合計 |
---|---|---|---|---|---|---|
人数 | 2 | 5 | 4 | 5 | 8 | 24 |
R による解析:
> dosuu <- c(2, 5, 4, 5, 8) > ks1(dosuu) # この関数の定義を見る $x [1] 2 5 4 5 8 $p [1] 0.2 0.2 0.2 0.2 0.2 $n [1] 24 $D [1] 0.1416667 $P [1] 0.6976136 # 正確な P 値
適合度の検定
例題:
「テストの弁別力を高めるためには得点の分布が矩形であること(一様分布)が望ましいといわれる。つまり,各得点の度数(確率)が等しい方がよい。 表 1 はあるテストの得点の分布を示すものである。真の分布は矩形といえるか。すなわち,各得点の確率は等しいといえるか。カイ二乗分布を用いる検定を行え。」
得点(中心点) | 10 | 12 | 14 | 16 | 18 | 20 | 22 | 24 | 合計 |
---|---|---|---|---|---|---|---|---|---|
観察度数 | 10 | 13 | 16 | 13 | 6 | 7 | 7 | 8 | 80 |
R による解析:
> chisq.test(c(10,13,16,13,6,7,7,8), p=rep(1/8,8)) Chi-squared test for given probabilities data: c(10, 13, 16, 13, 6, 7, 7, 8) X-squared = 9.2, df = 7, p-value = 0.2386
適合度の検定--順序尺度以上の場合
例題:
「テストの弁別力を高めるためには得点の分布が矩形であること(一様分布)が望ましいといわれる。つまり,各得点の度数(確率)が等しい方がよい。 表 1 はあるテストの得点の分布を示すものである。真の分布は矩形といえるか。すなわち,各得点の確率は等しいといえるか。」
得点(中心点) | 10 | 12 | 14 | 16 | 18 | 20 | 22 | 24 | 合計 |
---|---|---|---|---|---|---|---|---|---|
観察度数 | 10 | 13 | 16 | 13 | 6 | 7 | 7 | 8 | 80 |
検定手順:
- 前提
- 帰無仮説 H0:「各カテゴリーの理論比が pi(i=1,2,... ,k)である」。
- 対立仮説 H1:「各カテゴリーの理論比が pi(i=1,2,... ,k)ではない」。
- 有意水準 α で両側検定を行う(片側検定も定義できる)。
- n 個のケースが,k 個のカテゴリーに分類されているとする。
例題では,n = 80,k = 8 である。
- 標本について累積相対度数を求め,理論累積相対度数との差をとる。
累積相対度数 階級 標本分布において 理論分布において 両者の差(di) 1 P11 P12 P11 - P12 2 P21 P22 P21 - P22 : : : : i Pi1 Pi2 Pi1 - Pi2 : : : : k 1.0 1.0 0.0
例題では,以下のような表を作る。
観察度数 相対度数 累積相対度数 理論度数 相対度数 累積相対度数 差 10 0.1250 0.1250 10 0.1250 0.1250 0.0000 13 0.1625 0.2875 10 0.1250 0.2500 0.0375 16 0.2000 0.4875 10 0.1250 0.3750 0.1125 13 0.1625 0.6500 10 0.1250 0.5000 0.1500 6 0.0750 0.7250 10 0.1250 0.6250 0.1000 7 0.0875 0.8125 10 0.1250 0.7500 0.0625 7 0.0875 0.9000 10 0.1250 0.8750 0.0250 8 0.1000 1.0000 10 0.1250 1.0000 0.0000 80 1.0000 80 1.0000
- 両側検定の場合には,差の絶対値 |di| のうち最も大きいもの dmax を検定統計量とする。
注:片側検定の場合,標本分布が理論分布より左にある(標本での代表値が理論値より小さい)場合には,累積相対度数の差 di = Pi1-Pi2 は正の値となる場合が多いと予想される。累積相対度数の差のうち,最も大きいものを dmax とすれば,代表値の差が大きければ大きいほど dmax も大きくなる。
例題では,dmax = 0.15 である。
- 統計数値表(α=0.05,α=0.01)を参照して,
例題では n = 80 なので統計数値表より,有意水準 5% における棄却限界値は 0.14960 である。したがって,帰無仮説は棄却される。すなわち,「一様分布していない」と結論する。
適合度の検定と同じ種類の言葉
- 適合度の検定のページへのリンク