クラスカル・ウォリス検定
例題:
「12 匹のラットに 3 種類の餌を与えたときの肝臓の重量は表 1 のようであった。餌の種類により肝臓の重量の平均値に差があるといえいるか,有意水準 5% で検定しなさい。」
A餌 | 3.42 | 3.84 | 3.96 | 3.76 | |
---|---|---|---|---|---|
B餌 | 3.17 | 3.63 | 3.47 | 3.44 | 3.39 |
C餌 | 3.64 | 3.72 | 3.91 |
R による解析:
> x <- c(3.42, 3.84, 3.96, 3.76, 3.17, 3.63, 3.47, 3.44, 3.39, 3.64, 3.72, 3.91) > g <- c(1,1,1,1,2,2,2,2,2,3,3,3) > kruskal.test(x,g) Kruskal-Wallis rank sum test data: x and g Kruskal-Wallis chi-squared = 5.5487, df = 2, p-value = 0.06239
クラスカル・ウォリス検定
例題:
「4 つの群についてある測定をおこなったところ,表 3 のような結果が得られた。代表値に差があるか有意水準 5% で検定しなさい。また,多重比較を行いなさい。」
群 1 | 13 | 10 | 12 | 19 | ||
---|---|---|---|---|---|---|
群 2 | 21 | 26 | 15 | 14 | 21 | |
群 3 | 27 | 28 | 21 | |||
群 4 | 13 | 16 | 19 | 10 | 12 | 19 |
R による解析:
> dat <- matrix(c( 13, 1, 10, 1, 12, 1, 19, 1, 21, 2, 26, 2, 15, 2, 14, 2, 21, 2, 27, 3, 28, 3, 21, 3, 13, 4, 16, 4, 19, 4, 10, 4, 12, 4, 19, 4 ), ncol=2, byrow=T) 前もって用意されている関数を使う場合 > kruskal.test(dat[,1], dat[,2]) Kruskal-Wallis rank sum test data: dat[, 1] and dat[, 2] Kruskal-Wallis chi-squared = 9.7471, df = 3, p-value = 0.02084 新たに定義した関数(多重比較も行う)を使う場合 > kruskal.wallis(dat, 1, 2) $Result Statistics(Chi-sq. value) d.f. P value 9.74705115 3.00000000 0.02084332 $Statistics Group 1 Group 2 Group 3 Group 4 Group 1 0.0000000 3.255721 7.306100 0.2024443 Group 2 3.2557208 0.000000 1.367571 2.3082068 Group 3 7.3061003 1.367571 0.000000 6.2941603 Group 4 0.2024443 2.308207 6.294160 0.0000000 $P.value Group 1 Group 2 Group 3 Group 4 Group 1 1.00000000 0.3538532 0.06275556 0.97719374 Group 2 0.35385318 1.0000000 0.71315348 0.51095052 Group 3 0.06275556 0.7131535 1.00000000 0.09814354 Group 4 0.97719374 0.5109505 0.09814354 1.00000000
クラスカル・ウォリス検定
例題:
「12 匹のラットに 3 種類の餌を与えたときの肝臓の重量は表 1 のようであった。餌の種類により肝臓の重量の平均値に差があるといえいるか,有意水準 5% で検定しなさい。また,多重比較を行いなさい。」
A餌 | 3.42 | 3.84 | 3.96 | 3.76 | |
---|---|---|---|---|---|
B餌 | 3.17 | 3.63 | 3.47 | 3.44 | 3.39 |
C餌 | 3.64 | 3.72 | 3.91 |
R による解析:
> dat <- matrix(c( + 3.42, 1, + 3.84, 1, + 3.96, 1, + 3.76, 1, + 3.17, 2, + 3.63, 2, + 3.47, 2, + 3.44, 2, + 3.39, 2, + 3.64, 3, + 3.72, 3, + 3.91, 3 + ), byrow=T, ncol=2) > kruskal.wallis(dat, 1, 2) # この関数の定義を見る [1] 3 10 12 9 1 6 5 4 2 7 8 11 1 2 3 34 18 26 $Result Statistics(Chi-sq. value) d.f. P value 5.54871795 2.00000000 0.06238946 $Statistics Group 1 Group 2 Group 3 Group 1 0.000000000 4.104274 0.003663004 Group 2 4.104273504 0.000000 3.702564103 Group 3 0.003663004 3.702564 0.000000000 $P.value Group 1 Group 2 Group 3 Group 1 1.0000000 0.1284601 0.9981702 Group 2 0.1284601 1.0000000 0.1570357 Group 3 0.9981702 0.1570357 1.0000000
クラスカル・ウォリス検定
例題:
「12 匹のラットに 3 種類の餌を与えたときの肝臓の重量は表 1 のようであった。餌の種類により肝臓の重量の平均値に差があるといえいるか,有意水準 5% で検定しなさい。」
A餌 | 3.42 | 3.84 | 3.96 | 3.76 | |
---|---|---|---|---|---|
B餌 | 3.17 | 3.63 | 3.47 | 3.44 | 3.39 |
C餌 | 3.64 | 3.72 | 3.91 |
検定手順:
- 前提
- k 群の標本において,各群のケース数を nj(j = 1, 2, ... , k),n = Σ nj とする。
- n 個の観測値を全てこみにして小さい方から順位をつける(同順位がある場合には平均順位をつける)。
例題では次の表のようになる。
表 2.餌の種類による肝臓の重量の順位 A餌 3 10 12 9 B餌 1 6 5 4 2 C餌 7 8 11
- 第 j 群の第 i ケースの順位を rij とし,第 j 群の順位の和を Rj = Σ rij とする(Σ Rj = n ( n + 1 ) / 2)。
例題では,R1 = 34,R2 = 18,R3 = 26 である。
- 次式で検定統計量 Sx を計算する。
注:同順位が多い場合には,検定統計量 Sx の修正が必要である。
m 種類の同順位があったとき,それぞれの同順位の個数を tj( j = 1, 2, ... , m )とする。例えば,順位が 5 となるものが 4 個,順位が 11 となるものが 5 個あった場合には,m = 2,t1 = 4,t2 = 5。
例題では,Sx = { 12 ( 342/4 + 182/5 + 262/3)}/ {12 ( 12 + 1 ) } - 3 ( 12 + 1 ) = 5.54872 となる(同順位はないので補正は必要ない。)。
- S0(または Sx) は,自由度が k - 1 の χ2 分布に従う。
例題では,Sx は,自由度 2 の χ2 分布に従う。
- 有意確率を P = Pr{χ2 ≧ S0} とする。
χ2分布表,または χ2 分布の上側確率の計算を参照すること。
例題では,自由度 2 の χ2 分布において,Pr{χ2 ≧ 5.99}= 0.05 であるから,P = Pr{χ2 ≧ 5.54872}> 0.05 である(正確な有意確率:P = 0.06239)。
- 帰無仮説の採否を決める。
注:群の数が 3 または 4 で全ケース数が少ない場合には,統計数値表(k = 3 のとき,k = 4 のとき)を参照すれば正確な検定結果が得られる。
S0 が,表から得られる棄却限界値より大きいときに帰無仮説を棄却する。
例題では,有意水準 5% で検定を行うとすれば(α = 0.05),P > α であるから,帰無仮説を採択する。すなわち,「母代表値に差があるとはいえない」。
統計数値表からは,棄却限界値 5.6564 が得られるので,Sx = 5.54872 < 5.6564 ゆえ,同じ結果となる。
対比較の手順:
全体の代表値の差の検定が有意なときには,シェッフェの方法による対比較を行える。
- 全順位の平均値は である。
例題の場合,( 12 + 1 ) / 2 = 6.5 である。
- 各群の順位の平均を とする。
例題の場合,それぞれ,8.5,3.6,8.666667 である。
- 各群の順位の分散を
とする。
例題の場合,{ ( 3 - 6.5 )2 + ( 10 - 6.5 )2 + … + ( 11 - 6.5 )2 } / ( 12 - 1 ) = 13
- i 群と j 群の対比較のための検定統計量 Sij を次式で計算する。
例題において,1 群と 2 群の比較は,S12 = ( 8.5 - 3.6 )2 / { ( 1 / 4 + 1 / 5 )・13 } = 4.104274
- Sij は,自由度が k - 1 の χ2 分布に従う。
例題では,自由度は 3 - 1 = 2
- 有意確率を Pij = Pr{χ2 ≧ Sij} とする。
例題において,1 群と 2 群の比較では,P12 = Pr{χ2 ≧ 4.104274 }= 0.128460
- 帰無仮説の採否を決める。
例題の場合は P12 > α ゆえ,帰無仮説は採択される。「1 群と 2 群の母代表値に差があるとはいえない」。
全ての群の組合せについて対比較を行ったときでも,検定全体の危険率が α 以下であることが保証される。
クラスカルウォリス検定と同じ種類の言葉
検定に関連する言葉 | 適合度の検定 二群の平均値の差の検定 クラスカルウォリス検定 フリードマン検定 コクランアーミテージ検定 |
- クラスカルウォリス検定のページへのリンク