二標本コルモゴロフ・スミルノフ検定
例題:
「表 1 のような二群のデータがある。身長の代表値に差があるかどうか,有意水準 5% で検定しなさい。」
観察度数 | 累積度数 | 累積相対度数 | |||||
---|---|---|---|---|---|---|---|
階級 | 第1群 | 第2群 | 第1群 | 第2群 | 第1群 | 第2群 | 差 |
142 | 1 | 0 | 1 | 0 | 0.005 | 0.000 | 0.005 |
143 | 2 | 1 | 3 | 1 | 0.014 | 0.005 | 0.009 |
144 | 1 | 2 | 4 | 3 | 0.019 | 0.016 | 0.003 |
145 | 3 | 2 | 7 | 5 | 0.032 | 0.026 | 0.007 |
146 | 2 | 4 | 9 | 9 | 0.042 | 0.047 | -0.005 |
147 | 3 | 5 | 12 | 14 | 0.056 | 0.073 | -0.017 |
148 | 3 | 6 | 15 | 20 | 0.069 | 0.104 | -0.034 |
149 | 2 | 8 | 17 | 28 | 0.079 | 0.145 | -0.066 |
150 | 7 | 10 | 24 | 38 | 0.111 | 0.197 | -0.086 |
151 | 11 | 7 | 35 | 45 | 0.162 | 0.233 | -0.071 |
152 | 10 | 16 | 45 | 61 | 0.208 | 0.316 | -0.108 |
153 | 9 | 17 | 54 | 78 | 0.250 | 0.404 | -0.154 |
154 | 13 | 17 | 67 | 95 | 0.310 | 0.492 | -0.182 |
155 | 13 | 13 | 80 | 108 | 0.370 | 0.560 | -0.189 |
156 | 22 | 19 | 102 | 127 | 0.472 | 0.658 | -0.186 |
157 | 17 | 13 | 119 | 140 | 0.551 | 0.725 | -0.174 |
158 | 23 | 18 | 142 | 158 | 0.657 | 0.819 | -0.161 |
159 | 20 | 10 | 162 | 168 | 0.750 | 0.870 | -0.120 |
160 | 17 | 4 | 179 | 172 | 0.829 | 0.891 | -0.062 |
161 | 14 | 6 | 193 | 178 | 0.894 | 0.922 | -0.029 |
162 | 13 | 6 | 206 | 184 | 0.954 | 0.953 | 0.000 |
163 | 5 | 5 | 211 | 189 | 0.977 | 0.979 | -0.002 |
164 | 2 | 1 | 213 | 190 | 0.986 | 0.984 | 0.002 |
165 | 1 | 3 | 214 | 193 | 0.991 | 1.000 | -0.009 |
166 | 1 | 0 | 215 | 193 | 0.995 | 1.000 | -0.005 |
167 | 1 | 0 | 216 | 193 | 1.000 | 1.000 | 0.000 |
合計 | 216 | 193 |
R による解析:
> obs1 <- c(1,2,1,3,2,3,3,2,7,11,10,9,13,13,22,17,23,20,17,14,13,5,2,1,1,1) > obs2 <- c(0,1,2,2,4,5,6,8,10,7,16,17,17,13,19,13,18,10,4,6,6,5,1,3,0,0) > ks2(obs1, obs2) # この関数の定義を見る D d.f. P value 0.189215122 2.000000000 0.001353201
二標本コルモゴロフ・スミルノフ検定
- 両側検定では,代表値の差だけでなく,分布の違い(ちらばり,非対称度)も検出する。したがって,帰無仮説が棄却された場合に,分布の違いが検出されたのか代表値の違いが検出されたのかを検討する必要がある。
- この検定手法は 2 群の分布の違いがどのようなものであっても検出してしまう。代表値の差の検定を行うためには,代表値の差以外の分布の形(散布度など)が 2 群で同じでなければならない。
- 分布の形が大幅に異なるならば,検定結果が有意であっても,代表値に差があることを意味するのか,分布の形が違うのか解釈できない。
- 代表値に差がないときに,分布が異なる場合には,この検定は分布の差の検定になる。
- 代表値の差を比較する変数が間隔尺度以上の場合にはカテゴリー化して検定に用いるが,カテゴリー数が少なすぎると検出力が弱くなるので注意しなければならない。
例題:
「表 1 のような二群のデータがある。身長の代表値に差があるかどうか,有意水準 5% で検定しなさい。」
観察度数 | 累積度数 | 累積相対度数 | |||||
---|---|---|---|---|---|---|---|
階級 | 第1群 | 第2群 | 第1群 | 第2群 | 第1群 | 第2群 | 差 |
142 | 1 | 0 | 1 | 0 | 0.005 | 0.000 | 0.005 |
143 | 2 | 1 | 3 | 1 | 0.014 | 0.005 | 0.009 |
144 | 1 | 2 | 4 | 3 | 0.019 | 0.016 | 0.003 |
145 | 3 | 2 | 7 | 5 | 0.032 | 0.026 | 0.007 |
146 | 2 | 4 | 9 | 9 | 0.042 | 0.047 | -0.005 |
147 | 3 | 5 | 12 | 14 | 0.056 | 0.073 | -0.017 |
148 | 3 | 6 | 15 | 20 | 0.069 | 0.104 | -0.034 |
149 | 2 | 8 | 17 | 28 | 0.079 | 0.145 | -0.066 |
150 | 7 | 10 | 24 | 38 | 0.111 | 0.197 | -0.086 |
151 | 11 | 7 | 35 | 45 | 0.162 | 0.233 | -0.071 |
152 | 10 | 16 | 45 | 61 | 0.208 | 0.316 | -0.108 |
153 | 9 | 17 | 54 | 78 | 0.250 | 0.404 | -0.154 |
154 | 13 | 17 | 67 | 95 | 0.310 | 0.492 | -0.182 |
155 | 13 | 13 | 80 | 108 | 0.370 | 0.560 | -0.189 |
156 | 22 | 19 | 102 | 127 | 0.472 | 0.658 | -0.186 |
157 | 17 | 13 | 119 | 140 | 0.551 | 0.725 | -0.174 |
158 | 23 | 18 | 142 | 158 | 0.657 | 0.819 | -0.161 |
159 | 20 | 10 | 162 | 168 | 0.750 | 0.870 | -0.120 |
160 | 17 | 4 | 179 | 172 | 0.829 | 0.891 | -0.062 |
161 | 14 | 6 | 193 | 178 | 0.894 | 0.922 | -0.029 |
162 | 13 | 6 | 206 | 184 | 0.954 | 0.953 | 0.000 |
163 | 5 | 5 | 211 | 189 | 0.977 | 0.979 | -0.002 |
164 | 2 | 1 | 213 | 190 | 0.986 | 0.984 | 0.002 |
165 | 1 | 3 | 214 | 193 | 0.991 | 1.000 | -0.009 |
166 | 1 | 0 | 215 | 193 | 0.995 | 1.000 | -0.005 |
167 | 1 | 0 | 216 | 193 | 1.000 | 1.000 | 0.000 |
合計 | 216 | 193 |
検定手順:
- 前提
- 各群について累積相対度数分布を求め,各階級で差をとる。
累積相対度数 階級 第 1 群 第 2 群 差(di) 1 P11 P12 P11 - P12 2 P21 P22 P21 - P22 : : : : i Pi1 Pi2 Pi1 - Pi2 : : : : k 1.0 1.0 0.0
- 両側検定の場合には,累積相対度数の差の絶対値 | di | のうち最も大きいものを検定統計量 D とする。
例題では,D = 0.189 である。
- 各群の例数を,n1,n2 として,以下の検定統計量を計算する。
例題では,n1 = 216,n2 = 193 であり,χ20 ≒ 14.563 である。
- n1,n2 > 40 のとき,χ20 は,近似的に自由度が 2 の χ2 分布に従う。
注:n1,n2 が 40 以下のとき,近似の程度は悪い。
- 有意確率を P = 2 × Pr{χ2 ≧ χ20}とする(P > 1 のときは,P = 1 とする)。
χ2分布の上側確率の計算を参照すること。
例題では,有意確率 P = 2 × 0.000688153 = 0.001376306。
- 帰無仮説の採否を決める。
例題では,有意水準 5% で検定を行うとすれば(α = 0.05),P < α であるから,帰無仮説を棄却する。すなわち,「身長の母代表値に差がある」といえる。
二標本コルモゴロフ・スミルノフ検定と同じ種類の言葉
検定に関連する言葉 | 符号検定 重相関係数の検定 ピアソンの積率相関係数の有意性検定 二標本コルモゴロフスミルノフ検定 シャピロウィルク検定 |
- 二標本コルモゴロフ・スミルノフ検定のページへのリンク