母比率の検定
例題:
「母不良率が 3% であるはずの生産工程から,製品 20 個を取り出したとき,不良品が 2 個あった。母不良率が 3% から変化しているかどうか検定しなさい。」
検定手順:
- 記号の定義
ケース数を n,そのうちで対象とする属性を持つもの(陽性数と呼ぶことにする)の数を r とする。標本比率を p = r / n,母比率を π,母比率の特定の値を π0 とする。
例題では,n = 20,r = 2,p = 2 / 20 = 0.1,π0 = 0.03 である。
- 前提
- 正規分布に近似する方法 ・・・・・・・・ min [ n × π0 , n × ( 1 - π0 ) ]≧ 5 の場合
例題の場合,n × π0 = 20 × 0.03 = 0.6 なので,正規分布に近似する方法は使用できない。
以下では,もしこの方法に依った場合どうなるかを示す。
- 以下の式で,検定統計量 Z0 を計算する。Z0 は,正規分布に従う。
例題の場合,Z0 ≒ 1.835 になる。
- 有意確率を P = Pr{|Z|≧ Z0}とする(片側検定の場合には片側確率を求めること)。
正規分布表,または正規分布の上側確率の計算を参照すること。
例題の場合,Pr{|Z|≧ 1.96}= 0.05 なので,P = Pr{|Z| ≧ 1.835}> 0.05 である(正確な有意確率:P = 0.06649)。
- 帰無仮説の採否を決める。
- P > α のとき,帰無仮説を採択する(片側検定のときは P / 2 と α を比較する)。「母比率は π0 と異なるとはいえない」。
- P ≦ α のとき,帰無仮説を棄却する。「母比率は π0 と異なる」。
例題では,有意水準 5% で検定を行うとすれば(α = 0.05),P > α であるから,帰無仮説を採択する。すなわち,「母不良率が 3% から変化しているとはいえない」。
- 以下の式で,検定統計量 Z0 を計算する。Z0 は,正規分布に従う。
- F 分布による方法(二項検定と等価)
- 検定統計量を計算する。
- p > π0 のとき
ν1 = 2 ( n - r + 1 ),ν2 = 2 r としたとき, 次式の F0 が,自由度(ν1,ν2)の F 分布に従うことを利用する。
例題はこの場合に該当し,ν1 = 38,ν2 = 4 なので,F0 ≒ 3.4035 となる。
- p < π0 のとき
ν1 = 2 ( r + 1 ),ν2 = 2 ( n - r )としたとき, 次式の F0 が,自由度(ν1,ν2)の F 分布に従うことを利用する。
- p > π0 のとき
- 自由度が(ν1,ν2)の F 分布において,有意確率を P = 2 × Pr{F ≧ F0}
とする。(注意)
F 分布表(α = 0.05,α = 0.025,α = 0.01,α = 0.005),または F 分布の上側確率の計算を参照すること。
例題では,P = 0.2397 である。
- 帰無仮説の採否を決める。
- P > α のとき,帰無仮説を採択する(片側検定のときは P / 2 と α を比較する)。「母比率は π0 と異なるとはいえない」。
- P ≦ α のとき,帰無仮説を棄却する。「母比率は π0 と異なる」。
例題では,有意水準 5% で検定を行うとすれば(α = 0.05),P > α であるから,帰無仮説を採択する。すなわち,「母不良率が 3% から変化しているとはいえない」といえる。
- 検定統計量を計算する。
母比率の検定
母比率の検定の手順の,F 分布による方法(二項検定と等価)において,
自由度が(ν1,ν2)の F 分布において,有意確率を P = 2 × Pr{F ≧ F0}
として,評価しているところがある。この方法は,二項分布が左右対称(に近い)ことを想定している。
そのような状況が想定できるのは,母比率が 0.5 に近い場合,または,母比率が 0.5 とかなり異なっていても標本サイズが大きい場合である(二項分布のページを参照のこと)。
両側検定の有意確率は,分布がほぼ左右対称ならば,「観察された場合を含みそれより極端な場合の生起確率の和の二倍」として定義できる(普通の定義)。しかし,分布が左右対称でないならば,片方の生起確率を二倍するのでは不適切である。そのような場合には,複数の考え方があるが,Fisher の正確確率検定において採用された定義は,「観察された事象の生起確率より小さい生起確率の総和を両側確率とする」というものである(有意確率の決定法のページを参照のこと)。
R では,母比率の検定は,F 分布を用いた正確な検定と等価な二項検定(二項分布を用いる検定)として行われる。そして,有意確率は後者の定義によって算出される。
母比率の検定に示した例題をそこに示した手順で解くと,P = 0.2397 ということになる。しかし,R によれば,以下のように P = 0.1198 ということになる。
> binom.test(2, 20, p=0.03) Exact binomial test data: 2 and 20 number of successes = 2, number of trials = 20, p-value = 0.1198 alternative hypothesis: true probability of success is not equal to 0.03 以下略
P 値が二倍も違うとは,驚くかもしれないが,二項分布のグラフを描いてみると一目瞭然である。
つまり,x=2 のときの二項分布の確率密度より小さいのは,右側にしかない。よって,先の定義によれば,x=2,3,...,20 の確率密度の和 0.119838 が,求める有意確率なのである。
x | 確率密度 f(x) | 累積和 | ![]() |
---|---|---|---|
0 | 0.543794 | 1.000000 | |
1 | 0.336368 | 0.456206 | |
2 | 0.098830 | 0.119838 | |
3 | 0.018340 | 0.021008 | |
4 | 0.002411 | 0.002669 | |
5 | 0.000239 | 0.000258 | |
6 | 0.000018 | 0.000020 | |
7 | 0.000001 | 0.000001 | |
8 | 5.735E-08 | 5.979E-08 | |
9 | 2.365E-09 | 2.448E-09 | |
10 | 8.045E-11 | 8.277E-11 | |
11 | 2.262E-12 | 2.315E-12 | |
12 | 5.247E-14 | 5.348E-14 | |
13 | 9.986E-16 | 1.014E-15 | |
14 | 1.544E-17 | 1.564E-17 | |
15 | 1.910E-19 | 1.929E-19 | |
16 | 1.846E-21 | 1.860E-21 | |
17 | 1.344E-23 | 1.351E-23 | |
18 | 6.926E-26 | 6.949E-26 | |
19 | 2.255E-28 | 2.258E-28 | |
20 | 3.487E-31 | 3.487E-31 |
母比率の検定と同じ種類の言葉
- 母比率の検定のページへのリンク