クラスカルウォリス検定とは何？わかりやすく解説 Weblio辞書

クラスカル・ウォリス検定

例題：
　「12 匹のラットに 3 種類の餌を与えたときの肝臓の重量は表 1 のようであった。餌の種類により肝臓の重量の平均値に差があるといえいるか，有意水準 5% で検定しなさい。」

表 1．餌の種類による肝臓の重量
A餌	3.42	3.84	3.96	3.76
B餌	3.17	3.63	3.47	3.44	3.39
C餌	3.64	3.72	3.91

R による解析:

> x <- c(3.42, 3.84, 3.96, 3.76, 3.17, 3.63, 3.47, 3.44, 3.39, 3.64, 3.72, 3.91)
> g <- c(1,1,1,1,2,2,2,2,2,3,3,3)

> kruskal.test(x,g)

	Kruskal-Wallis rank sum test

data:  x and g 
Kruskal-Wallis chi-squared = 5.5487, df = 2, p-value = 0.06239

クラスカル・ウォリス検定

例題：
　「4 つの群についてある測定をおこなったところ，表 3 のような結果が得られた。代表値に差があるか有意水準 5% で検定しなさい。また，多重比較を行いなさい。」

表 3．測定値
群 1	13	10	12	19
群 2	21	26	15	14	21
群 3	27	28	21
群 4	13	16	19	10	12	19

R による解析:

> dat <- matrix(c(
 	13, 1, 10, 1, 12, 1, 19, 1,
 	21, 2, 26, 2, 15, 2, 14, 2, 21, 2,
 	27, 3, 28, 3, 21, 3,
 	13, 4, 16, 4, 19, 4, 10, 4, 12, 4, 19, 4
 	), ncol=2, byrow=T)

前もって用意されている関数を使う場合

> kruskal.test(dat[,1], dat[,2])

	Kruskal-Wallis rank sum test

data:  dat[, 1] and dat[, 2] 
Kruskal-Wallis chi-squared = 9.7471, df = 3, p-value = 0.02084

新たに定義した関数（多重比較も行う）を使う場合

> kruskal.wallis(dat, 1, 2)
$Result
Statistics(Chi-sq. value)         d.f.      P value 
               9.74705115   3.00000000   0.02084332 

$Statistics
          Group 1  Group 2  Group 3   Group 4
Group 1 0.0000000 3.255721 7.306100 0.2024443
Group 2 3.2557208 0.000000 1.367571 2.3082068
Group 3 7.3061003 1.367571 0.000000 6.2941603
Group 4 0.2024443 2.308207 6.294160 0.0000000

$P.value
           Group 1   Group 2    Group 3    Group 4
Group 1 1.00000000 0.3538532 0.06275556 0.97719374
Group 2 0.35385318 1.0000000 0.71315348 0.51095052
Group 3 0.06275556 0.7131535 1.00000000 0.09814354
Group 4 0.97719374 0.5109505 0.09814354 1.00000000

クラスカル・ウォリス検定

例題：
　「12 匹のラットに 3 種類の餌を与えたときの肝臓の重量は表 1 のようであった。餌の種類により肝臓の重量の平均値に差があるといえいるか，有意水準 5% で検定しなさい。また，多重比較を行いなさい。」

表 1．餌の種類による肝臓の重量
A餌	3.42	3.84	3.96	3.76
B餌	3.17	3.63	3.47	3.44	3.39
C餌	3.64	3.72	3.91

R による解析:

> dat <- matrix(c(
+ 	3.42, 1,
+ 	3.84, 1,
+ 	3.96, 1,
+ 	3.76, 1,
+ 	3.17, 2,
+ 	3.63, 2,
+ 	3.47, 2,
+ 	3.44, 2,
+ 	3.39, 2,
+ 	3.64, 3,
+ 	3.72, 3,
+ 	3.91, 3
+ 	), byrow=T, ncol=2)

> kruskal.wallis(dat, 1, 2)	# この関数の定義を見る
 [1]  3 10 12  9  1  6  5  4  2  7  8 11
 1  2  3 
34 18 26 
$Result
Statistics(Chi-sq. value)                      d.f.                   P value 
               5.54871795                2.00000000                0.06238946 

$Statistics
            Group 1  Group 2     Group 3
Group 1 0.000000000 4.104274 0.003663004
Group 2 4.104273504 0.000000 3.702564103
Group 3 0.003663004 3.702564 0.000000000

$P.value
          Group 1   Group 2   Group 3
Group 1 1.0000000 0.1284601 0.9981702
Group 2 0.1284601 1.0000000 0.1570357
Group 3 0.9981702 0.1570357 1.0000000

クラスカル・ウォリス検定

表 1．餌の種類による肝臓の重量
A餌	3.42	3.84	3.96	3.76
B餌	3.17	3.63	3.47	3.44	3.39
C餌	3.64	3.72	3.91

検定手順:

前提
- 帰無仮説 H0：「母代表値に差はない」。
- 対立仮説 H1：「母代表値に差がある」。
- 有意水準 α で両側検定を行う（片側検定は定義できない）。
k 群の標本において，各群のケース数を nj（j = 1， 2， ... ， k），n = Σ nj とする。
n 個の観測値を全てこみにして小さい方から順位をつける（同順位がある場合には平均順位をつける）。
例題では次の表のようになる。

表 2．餌の種類による肝臓の重量の順位
A餌 3 10 12 9

B餌 1 6 5 4 2

C餌 7 8 11
第 j 群の第 i ケースの順位を rij とし，第 j 群の順位の和を Rj = Σ rij とする（Σ Rj = n ( n + 1 ) / 2）。
例題では，R1 = 34，R2 = 18，R3 = 26 である。
次式で検定統計量 Sx を計算する。

注：同順位が多い場合には，検定統計量 Sx の修正が必要である。
m 種類の同順位があったとき，それぞれの同順位の個数を tj（ j = 1， 2， ... ， m ）とする。例えば，順位が 5 となるものが 4 個，順位が 11 となるものが 5 個あった場合には，m = 2，t1 = 4，t2 = 5。

例題では，Sx = ｛ 12 ( 34²/4 + 18²/5 + 26²/3)｝/ {12 ( 12 + 1 ) ｝ - 3 ( 12 + 1 ) = 5.54872 となる（同順位はないので補正は必要ない。）。
S0（または Sx）は，自由度が k - 1 の χ² 分布に従う。
例題では，Sx は，自由度 2 の χ² 分布に従う。
有意確率を P = Pr｛χ² ≧ S0｝とする。
χ²分布表，または χ² 分布の上側確率の計算を参照すること。
例題では，自由度 2 の χ² 分布において，Pr｛χ² ≧ 5.99｝= 0.05 であるから，P = Pr｛χ² ≧ 5.54872｝＞ 0.05 である（正確な有意確率：P = 0.06239）。
帰無仮説の採否を決める。
- P ＞ α のとき，帰無仮説を採択する。「母代表値に差があるとはいえない」。
- P ≦ α のとき，帰無仮説を棄却する。「母代表値に差がある」。
注：群の数が 3 または 4 で全ケース数が少ない場合には，統計数値表（k = 3 のとき，k = 4 のとき）を参照すれば正確な検定結果が得られる。
S0 が，表から得られる棄却限界値より大きいときに帰無仮説を棄却する。
例題では，有意水準 5% で検定を行うとすれば（α = 0.05），P ＞ α であるから，帰無仮説を採択する。すなわち，「母代表値に差があるとはいえない」。
統計数値表からは，棄却限界値 5.6564 が得られるので，Sx = 5.54872 ＜ 5.6564 ゆえ，同じ結果となる。

表 2．餌の種類による肝臓の重量の順位
A餌	3	10	12	9
B餌	1	6	5	4	2
C餌	7	8	11

対比較の手順:
　全体の代表値の差の検定が有意なときには，シェッフェの方法による対比較を行える。

全順位の平均値は　である。
例題の場合，( 12 + 1 ) / 2 = 6.5 である。
各群の順位の平均を　とする。
例題の場合，それぞれ，8.5，3.6，8.666667 である。
各群の順位の分散を

とする。
例題の場合，{ ( 3 - 6.5 )² + ( 10 - 6.5 )² + … + ( 11 - 6.5 )² } / ( 12 - 1 ) = 13
i 群と j 群の対比較のための検定統計量 Sij を次式で計算する。

例題において，1 群と 2 群の比較は，S12 = ( 8.5 - 3.6 )² / { ( 1 / 4 + 1 / 5 )・13 } = 4.104274
Sij は，自由度が k - 1 の χ² 分布に従う。
例題では，自由度は 3 - 1 = 2
有意確率を Pij = Pr｛χ² ≧ Sij｝とする。
例題において，1 群と 2 群の比較では，P12 = Pr｛χ² ≧ 4.104274 ｝= 0.128460
帰無仮説の採否を決める。
- Pij ＞ α のとき，帰無仮説を採択する。「i 群と j 群の母代表値に差があるとはいえない」。
- Pij ≦ α のとき，帰無仮説を棄却する。「i 群と j 群の母代表値に差がある」。
例題の場合は P12 ＞ α ゆえ，帰無仮説は採択される。「1 群と 2 群の母代表値に差があるとはいえない」。