適合度の検定とは何？わかりやすく解説 Weblio辞書

索引トップ用語の索引ランキング

適合度の検定

適合度の検定--ポアソン分布への適合度の検定

例題：
　「表 1 は，ある都市の交通事故件数のデータである。これに，ポアソン分布をあてはめ，適合度の検定をせよ。」

表 1．交通事故件数
死亡者数	実測値	相対度数	ポアソン分布
Xi	fi	fi/365	f(X)	期待度数
0	27	0.074	0.050	18.322
1	61	0.167	0.150	54.816
2	77	0.211	0.225	81.999
3	71	0.195	0.224	81.774
4	54	0.148	0.168	61.163
5	35	0.096	0.100	36.597
6	20	0.055	0.050	18.248
7	11	0.030	0.021	7.799
8	6	0.016	0.008	2.917
9	2	0.005	0.003	0.970
10〜	1	0.003	0.001	0.395
合計	365	1.000	1.000	365.000

注：母平均（ポアソン定数）が既知の場合には以下の方法ではなく，名義尺度の場合または順序尺度以上の場合（1 標本コルモゴロフスミルノフ検定）により検定を行う。

検定手順：

前提
- 帰無仮説 H0：「母分布はポアソン分布である」。
- 対立仮説 H1：「母分布はポアソン分布ではない」。
- 有意水準 α の両側検定を行う（片側検定は定義できない）。
まず最初に，ポアソン分布のパラメータを推定する。
注：測定値の分布にポアソン分布をあてはめるときには一般に母平均がわからないので，以下のように標本値で代用しなければならない。
1. n 個のケースが，k 個のカテゴリーに分類されているとする。
  例題では，n = 365，k = 11 である。
2. 与えられた度数分布表から，母平均（= 母分散）λ を推定する。
  各階級の値を Xi（i=0，1，...，k-1），観測度数を fi とすれば，
  
  例題では，標本平均 = (0・27 +1・61+2・77+...+9・2+10・1) / 365 = 2.99178 となる。これを λ の推定値とする。
各カテゴリーの期待値は，
例題では，表 1 の 5 列目に計算結果を示す。
期待値が 1 以下のカテゴリーを併合する。併合後のカテゴリー数を m とする。
例題では，最後の 2 行をまとめる（死亡者数が 9 以上を一つのカテゴリーとする）。m = 10 になる。
以下の式で検定統計量を計算する。

例題では，χ²0 = 14.143 となる。
χ²0 は，自由度が m-1-1 の χ² 分布に従う（母平均の推定を行ったため，自由度が 1 余分に減る）。
例題では，自由度は 8 である。
有意確率を P = Pr｛χ² ≧ χ²0｝とする。
χ² 分布表，または χ² 分布の上側確率の計算を参照すること。
例題では，自由度 8 の χ² 分布において，Pr｛χ² ≧ 15.51｝= 0.05 であるから，P = Pr｛χ² ≧ 14.143｝＞ 0.05 である（正確な有意確率：P = 0.078）。
帰無仮説の採否を決める。
- P ＞ α のとき，帰無仮説を採択する。「母分布はポアソン分布でないとはいえない」。
- P ≦ α のとき，帰無仮説を棄却する。「母分布はポアソン分布ではない」。
例題では，有意水準 5% で検定を行うとすれば（α = 0.05），P ＞ α であるから，帰無仮説を採択する。すなわち，「ポアソン分布に従っていないとはいえない」。

適合度の検定--名義尺度の場合

例題：
　「サイコロを 56 回振って目の出方を調べたところ，表 1 のようになった。このサイコロは正しいサイコロといえるだろうか。」

表 1．サイコロの目の出た回数
出た目	1	2	3	4	5	6	合計
度数	10	12	9	4	13	8	56

R による解析：

> chisq.test(c(10, 12, 9, 4, 13, 8))

	Chi-squared test for given probabilities

data:  c(10, 12, 9, 4, 13, 8) 
X-squared = 5.5, df = 5, p-value = 0.3579

自作のexact な検定関数によれば，計算時間がかかるが以下のような結果になる。

> gft(c(10, 12, 9, 4, 13, 8))
カイ二乗値は 5.5，自由度は 5，Ｐ値は 0.357946
正確なＰ値は 0.370005

適合度の検定--名義尺度の場合

例題：
　「表 2 において，表現形質が 9：3：3：1 になっているかどうか検定しなさい。」

表 2．表現形質がメンデルの遺伝法則に従うかどうか
表現形質	AA	Ab	aB	ab	合計
観察度数	29	12	8	2	51

R による解析：

> chisq.test(c(29, 12, 8, 2), p=c(9, 3, 3, 1)/16)

	Chi-squared test for given probabilities

data:  c(29, 12, 8, 2) 
X-squared = 1.3224, df = 3, p-value = 0.7238

Warning message: 
Chi-squared approximation may be incorrect in: chisq.test(c(29, 12, 8, 2), p = c(9, 3, 3, 1)/16)

自作のexact な検定関数によれば，以下のような結果になる。

> gft(c(29, 12, 8, 2), p=c(9, 3, 3, 1))
カイ二乗値は 1.32244，自由度は 3，Ｐ値は 0.723811
正確なＰ値は 0.741471

適合度の検定--名義尺度の場合

例題：
　「サイコロを 56 回振って目の出方を調べたところ，表 1 のようになった。このサイコロは正しいサイコロといえるだろうか。」

表 1．サイコロの目の出た回数
出た目	1	2	3	4	5	6	合計
度数	10	12	9	4	13	8	56

検定手順：

前提
- 帰無仮説 H0：「各カテゴリーの理論比が pi（i=1，2，... ，k）である」。
- 対立仮説 H1：「各カテゴリーの理論比が pi（i=1，2，... ，k）ではない」。
- 有意水準 α で両側検定を行う（片側検定は定義できない）。
n 個のケースが，k 個のカテゴリーに分類されているとする。
例題では，n = 56，k = 6 である。
Oi：　第 i カテゴリーの観察値
例題では，O1 = 10，O2 = 12，... ，O6 = 8 である。
Ei = n pi ：　第 i カテゴリーの期待値
 例題では，正しいサイコロならば，どの目の出る確率も等しく 1/6 であるはずである（p1 = p2 = ... = p6 = 1/6 ）。
したがって，各目の出る期待値は，E1 = E2 = ... = E6 =56×(1/6) = 9.333 である。
期待値が 1 以下のカテゴリーを併合する。併合後のカテゴリー数を m とする。
例題では，このステップは不要である。
m = k = 6 である。
以下の式で検定統計量を計算する。

例題では，χ²0 = [ (10-56/6)²+(12-56/6)²+ ... + (8-56/6)² ] / (56/6) = 5.5 となる。
χ²0 は，自由度が m-1 の χ² 分布に従う。
例題では，自由度が 5 の χ² 分布に従う。
有意確率を P = Pr｛χ² ≧ χ²0｝とする。
χ²分布表，または χ² 分布の上側確率の計算を参照すること。
例題では，自由度 5 の χ² 分布において，Pr｛χ² ≧ 11.07｝= 0.05 であるから，P = Pr｛χ² ≧ 5.5｝＞ 0.05 である（正確な有意確率：P = 0.3579459）。
帰無仮説の採否を決める。
- P ＞ α のとき，帰無仮説を採択する。「所与の理論比に従っていないとはいえない」。
- P ≦ α のとき，帰無仮説を棄却する。「所与の理論比に従っていない」。
例題では，有意水準 5% で検定を行うとすれば（α = 0.05），P ＞ α であるから，帰無仮説を採択する。すなわち，「サイコロの目の出方は等しくないとはいえない」。

注１：理論比が一定 pi（i=1，2，... ，k）の場合は，特に一様性の検定と呼ばれる。
注２：順序尺度データ以上の場合には，もっと適切な検定手法がある。

適合度の検定--正規分布への適合度の検定

例題：
　「体重を測定した結果（測定精度は 0.1kg）が表 1 のようにまとめられた（表の左２列）。このデータは正規分布に従っているといえるだろうか。」

表 1．体重の分布
階級	度数 f	下限点	上限点	級中心 x	f x	f x²	z	F(z)	理論比	期待値
35〜	0	34.95	39.95	37.45	0.00	0.00	-3.50	0.0002	0.0002	0.098
40〜	4	39.95	44.95	42.45	169.80	7208.01	-2.53	0.0057	0.0055	2.340
45〜	19	44.95	49.95	47.45	901.55	42788.55	-1.55	0.0600	0.0543	23.124
50〜	86	49.95	54.95	52.45	4510.70	236586.22	-0.58	0.2807	0.2207	94.020
55〜	177	54.95	59.95	57.45	10168.65	534188.94	0.39	0.6529	0.3722	158.568
60〜	105	59.95	64.95	62.45	6557.25	409500.26	1.37	0.9142	0.2613	111.310
65〜	33	64.95	69.95	67.45	2225.85	150133.58	2.34	0.9904	0.0762	32.446
70〜	2	69.95	74.95	72.45	144.90	10498.01	3.32	0.9995	0.0092	3.899
75〜	0	74.95	79.95	77.45	0.00	0.00	4.29	1.0000	0.0005	0.195
合計	426				24678.70	1440893.57			1.0000	426.000

注：母平均，母分散が既知の場合には以下の方法ではなく，名義尺度の場合または順序尺度以上の場合（1 標本コルモゴロフスミルノフ検定）により検定を行う。

検定手順:

前提
- 帰無仮説 H0：「母分布は正規分布である」。
- 対立仮説 H1：「母分布は正規分布ではない」。
- 有意水準 α で両側検定を行う（片側検定は定義できない）。
まず最初に，正規分布のパラメータを推定する。
注：測定値の分布に正規分布をあてはめるときには一般に母平均，母分散がわからないので，以下のように標本値で代用しなければならない。
1. n 個のケースが，k 個のカテゴリーに分類されているとする。
  
  例題では，n = 426，k = 9（階級「35〜」と「75〜」は以下の計算を行うために作られたものである）。
2. 各階級の中心点を Xi，観測度数を fi とする。
  例題では，測定精度が 0.1 kg なので，たとえば「50kg 以上 55kg 未満」という階級の真の限点は 49.95kg と 54.95kg である。級中心はその中点で，52.45kg である（50kg と 55kg の中点の 52.5kg ではないことに注意）。
  
  図 1．限点・級中心の定義
3. 与えられた度数分布表から，母平均と母分散の推定値 Mean，Variance を推定する。
  
  例題では，表 1 の 6 列目の合計欄の 24678.70 を n = 426 で割って，Mean = 57.9312，7 列目の合計欄の 1440893.57 を用いて Variance = 26.3528。
4. 第 i 階級と第 i+1 階級の限点を X'i，それに対する標準化得点を Zi とする。
  
  例題では，表 1 の 8 列目。
5. 各 Zi から Z ＜ Zi となる確率 Pi を求め（標準正規分布表，または正規分布の上側確率の計算を参照する），差をとることにより各階級の確率 pi = Pi - Pi-1（i = 2，3，... ，k-1）を求める。
  p1 = Pr｛Z ＜ Z1｝
  pk = 1 - ( p1 + p2 + ... + pk-1 )。
  例題では，表 1 の 9，10 列目。
理論度数は，Ei = n pi となる。
例題では，表 1 の 11 列目。

図 2．あてはめ結果
期待値が 1 以下のカテゴリーを併合する。併合後のカテゴリー数を m とする。
例題では，表 1 の最初の 2 行を一つに合併し，最後の 2 行を一つに合併する。m = 7 である。
以下の式で検定統計量を計算する。

例題では，χ²0 = 6.000 となる。
χ²0 は，自由度が m - 1 - 2 の χ² 分布に従う(母平均と母分散の推定を行ったため，自由度が 2 だけ余分に減る。）
例題では，自由度が 7 - 1 - 2 = 4 の χ² 分布に従うことになる。
有意確率を P = Pr｛χ² ≧ χ²0｝とする。
χ² 分布表，または χ² 分布の上側確率の計算を参照すること。
例題では，自由度 4 の χ² 分布において，Pr｛χ² ≧ 9.49｝= 0.05 であるから，P = Pr｛χ² ≧ 6.000｝＞ 0.05 である（正確な有意確率：P = 0.199）。
帰無仮説の採否を決める。
- P ＞ α のとき，帰無仮説を採択する。「母分布は正規分布でないとはいえない」。
- P ≦ α のとき，帰無仮説を棄却する。「母分布は正規分布ではない」。
例題では，有意水準 5% で検定を行うとすれば（α = 0.05），P ＞ α であるから，帰無仮説を採択する。すなわち，「正規分布に従っていないとはいえない」。

適合度の検定--順序尺度以上の場合

例題：
　「テストの弁別力を高めるためには得点の分布が矩形であること（一様分布）が望ましいといわれる。つまり，各得点の度数（確率）が等しい方がよい。表 1 はあるテストの得点の分布を示すものである。真の分布は矩形といえるか。すなわち，各得点の確率は等しいといえるか。」

表 1．テストの得点分布
得点（中心点）	10	12	14	16	18	20	22	24	合計
観察度数	10	13	16	13	6	7	7	8	80

R による解析：

> dosuu <- c(10, 13, 16, 13, 6, 7, 7, 8)
> ks1(dosuu)	# この関数の定義を見る
$x
[1] 10 13 16 13  6  7  7  8

$p	# 実際に適用された母比率ベクトル
[1] 0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125

$n
[1] 80

$D
[1] 0.15

$P
[1] 0.04902089	# 正確な P 値

適合度の検定--順序尺度以上の場合

例題：
　「24 人の患者にある薬剤を投与し，その効果を調べた結果は，表 2 のようになった。治療効果を検討するために，各患者の効果判定が一様に分布するかどうかを検定したい。」

表 2．治療効果の判定結果
判定	悪化	不変	やや改善	改善	非常に改善	合計
人数	2	5	4	5	8	24

R による解析：

> dosuu <- c(2, 5, 4, 5, 8)
> ks1(dosuu)	# この関数の定義を見る
$x
[1] 2 5 4 5 8

$p
[1] 0.2 0.2 0.2 0.2 0.2

$n
[1] 24

$D
[1] 0.1416667

$P
[1] 0.6976136	# 正確な P 値

適合度の検定

例題：
　「テストの弁別力を高めるためには得点の分布が矩形であること（一様分布）が望ましいといわれる。つまり，各得点の度数（確率）が等しい方がよい。表 1 はあるテストの得点の分布を示すものである。真の分布は矩形といえるか。すなわち，各得点の確率は等しいといえるか。カイ二乗分布を用いる検定を行え。」

表 1．テストの得点分布
得点（中心点）	10	12	14	16	18	20	22	24	合計
観察度数	10	13	16	13	6	7	7	8	80

R による解析：

> chisq.test(c(10,13,16,13,6,7,7,8), p=rep(1/8,8))

	Chi-squared test for given probabilities

data:  c(10, 13, 16, 13, 6, 7, 7, 8) 
X-squared = 9.2, df = 7, p-value = 0.2386

適合度の検定--順序尺度以上の場合

表 1．テストの得点分布
得点（中心点）	10	12	14	16	18	20	22	24	合計
観察度数	10	13	16	13	6	7	7	8	80

検定手順：

前提
- 帰無仮説 H0：「各カテゴリーの理論比が pi（i=1，2，... ，k）である」。
- 対立仮説 H1：「各カテゴリーの理論比が pi（i=1，2，... ，k）ではない」。
- 有意水準 α で両側検定を行う（片側検定も定義できる）。
n 個のケースが，k 個のカテゴリーに分類されているとする。
例題では，n = 80，k = 8 である。

標本について累積相対度数を求め，理論累積相対度数との差をとる。

累積相対度数
階級	標本分布において	理論分布において	両者の差（di）
1	P11	P12	P11 - P12
2	P21	P22	P21 - P22
:	:	:	:
i	Pi1	Pi2	Pi1 - Pi2
:	:	:	:
k	1.0	1.0	0.0

例題では，以下のような表を作る。

観察度数	相対度数	累積相対度数	理論度数	相対度数	累積相対度数	差
10	0.1250	0.1250	10	0.1250	0.1250	0.0000
13	0.1625	0.2875	10	0.1250	0.2500	0.0375
16	0.2000	0.4875	10	0.1250	0.3750	0.1125
13	0.1625	0.6500	10	0.1250	0.5000	0.1500
6	0.0750	0.7250	10	0.1250	0.6250	0.1000
7	0.0875	0.8125	10	0.1250	0.7500	0.0625
7	0.0875	0.9000	10	0.1250	0.8750	0.0250
8	0.1000	1.0000	10	0.1250	1.0000	0.0000
80	1.0000		80	1.0000