適合度の検定とは? わかりやすく解説

Weblio 辞書 > 同じ種類の言葉 > 人文 > 統計 > 検定 > 適合度の検定の意味・解説 

適合度の検定


適合度の検定--ポアソン分布への適合度の検定


例題
 「表 1 は,ある都市交通事故件数データである。これに,ポアソン分布あてはめ,適合度の検定をせよ。」
表 1交通事故件数
死亡者数 実測値 相対度数 ポアソン分布
Xi fi fi/365 f(X) 期待度数
0  27 0.074 0.050 18.322
1  61 0.167 0.150 54.816
2  77 0.211 0.225 81.999
3  71 0.195 0.224 81.774
4  54 0.148 0.168 61.163
5  35 0.096 0.100 36.597
6  20 0.055 0.050 18.248
7  11 0.030 0.021 7.799
8  6 0.016 0.008 2.917
9  2 0.005 0.003 0.970
10 1 0.003 0.001 0.395
合計  365 1.000 1.000 365.000

注:母平均ポアソン定数)が既知の場合には以下の方法ではなく名義尺度場合 または 順序尺度上の場合(1 標本コルモゴロフスミルノフ検定)により検定を行う。


検定手順
  1. 前提
  2. まず最初にポアソン分布パラメータ推定する
    注:測定値分布ポアソン分布あてはめるときには一般に平均わからないので,以下のように標本値代用しなければならない
    1. n 個のケースが,k 個のカテゴリー分類されているとする。
      例題では,n = 365,k = 11 である。
    2. 与えられ度数分布表から,母平均(= 母分散)λ を推定する
      各階級の値を Xi(i=0,1,...,k-1),観測度数fi とすれば
      適合度の検定--ポアソン分布への適合度の検定
      適合度の検定--ポアソン分布への適合度の検定
      例題では,標本平均 = (0・27+161+2・77+...+9・2+10・1) / 365 = 2.99178 となる。これを λ の推定値とする。

  3. カテゴリー期待値は, 適合度の検定--ポアソン分布への適合度の検定
    例題では,表 1 の 5 列目に計算結果を示す。
  4. 期待値1 以下カテゴリー併合する併合後のカテゴリー数を m とする。
    例題では,最後の 2 行をまとめる(死亡者数が 9 以上を一つカテゴリーとする)。m = 10 になる。
  5. 以下の式で検定統計量計算する
    適合度の検定--ポアソン分布への適合度の検定
    例題では,χ20 = 14.143 となる。
  6. χ20 は,自由度m-1-1 の χ2 分布に従う(母平均推定行ったため,自由度が 1 余分に減る)。
    例題では,自由度は 8 である。
  7. 有意確率P = Pr{χ2 ≧ χ20}とする。
    χ2 分布表,または χ2 分布の上確率計算参照すること。
    例題では,自由度 8 の χ2 分布において,Pr{χ2 ≧ 15.51}= 0.05 であるからP = Pr{χ2 ≧ 14.143}> 0.05 である(正確な有意確率P = 0.078)。
  8. 帰無仮説採否決める。

    例題では,有意水準 5% で検定を行うとすれば(α = 0.05),P > α であるから帰無仮説採択する。すなわち,「ポアソン分布に従っていないとはいえない」。




適合度の検定--名義尺度の場合


例題
 「サイコロ56振って目の出方調べたところ,表 1ようになった。このサイコロ正しサイコロといえるだろうか。」
表 1サイコロの目の出た回数
出た  1  2  3  4  5  6  合計
度数 10 12 9 4 13 8 56



R による解析
> chisq.test(c(10, 12, 9, 4, 13, 8))

	Chi-squared test for given probabilities

data:  c(10, 12, 9, 4, 13, 8) 
X-squared = 5.5, df = 5, p-value = 0.3579
自作exact検定関数によれば計算時間がかかるが以下のような結果になる。
> gft(c(10, 12, 9, 4, 13, 8))
カイ二乗値は 5.5,自由度は 5,P値は 0.357946
正確なP値は 0.370005


適合度の検定--名義尺度の場合


例題
 「表 2 において,表現形質が 9:3:3:1 になっているかどうか検定しなさい。」
表 2表現形質メンデル遺伝法則に従うかどうか
表現形質 AA Ab aB ab 合計
観察度数 29 12 8 2 51



R による解析
> chisq.test(c(29, 12, 8, 2), p=c(9, 3, 3, 1)/16)

	Chi-squared test for given probabilities

data:  c(29, 12, 8, 2) 
X-squared = 1.3224, df = 3, p-value = 0.7238

Warning message: 
Chi-squared approximation may be incorrect in: chisq.test(c(29, 12, 8, 2), p = c(9, 3, 3, 1)/16) 
自作exact検定関数によれば,以下のような結果になる。
> gft(c(29, 12, 8, 2), p=c(9, 3, 3, 1))
カイ二乗値は 1.32244,自由度は 3,P値は 0.723811
正確なP値は 0.741471


適合度の検定--名義尺度の場合


例題
 「サイコロ56振って目の出方調べたところ,表 1ようになった。このサイコロ正しサイコロといえるだろうか。」
表 1サイコロの目の出た回数
出た  1  2  3  4  5  6  合計
度数 10 12 9 4 13 8 56



検定手順
  1. 前提
  2. n 個のケースが,k 個のカテゴリー分類されているとする。
    例題では,n = 56k = 6 である。
  3. Oi: 第 i カテゴリー観察
    例題では,O1 = 10,O2 = 12,... ,O6 = 8 である。
  4. Ei = n pi : 第 i カテゴリー期待値
    例題では,正しサイコロならば,どの目の出る確率等しく 1/6 であるはずである(p1 = p2 = ... = p6 = 1/6 )。
    たがって,各目の出る期待値は,E1 = E2 = ... = E6 =56×(1/6) = 9.333 である。
  5. 期待値1 以下カテゴリー併合する併合後のカテゴリー数を m とする。
    例題では,このステップ不要である。
    m = k = 6 である。
  6. 以下の式で検定統計量計算する
    適合度の検定--名義尺度の場合
    例題では,χ20 = [ (10-56/6)2+(12-56/6)2+ ... + (8-56/6)2 ] / (56/6) = 5.5 となる。
  7. χ20 は,自由度が m-1 の χ2 分布に従う。
    例題では,自由度が 5 の χ2 分布に従う。
  8. 有意確率P = Pr{χ2 ≧ χ20}とする。
    χ2分布表,または χ2 分布の上確率計算参照すること。
    例題では,自由度 5 の χ2 分布において,Pr{χ2 ≧ 11.07}= 0.05 であるからP = Pr{χ2 ≧ 5.5}> 0.05 である(正確な有意確率P = 0.3579459)。
    適合度の検定--名義尺度の場合
  9. 帰無仮説採否決める。

    例題では,有意水準 5% で検定を行うとすれば(α = 0.05),P > α であるから帰無仮説採択する。すなわち,「サイコロの目の出方等しくないとはいえない」。

注1理論比が一定 pi(i=1,2,... ,k)の場合は,特に一様性検定呼ばれる
注2順序尺度データ上の場合には,もっと適切な検定手法がある。

適合度の検定--正規分布への適合度の検定


例題
 「体重測定した結果測定精度は 0.1kg)が表 1 のようにまとめられた(表の左2列)。このデータ正規分布に従っているといえるだろうか。」
表 1体重分布
階級 度数 f 下限 上限 中心 x f x f x2 z F(z) 理論 期待値
35 0 34.95 39.95 37.45 0.00 0.00 -3.50 0.0002 0.0002 0.098
40 4 39.95 44.95 42.45 169.80 7208.01 -2.53 0.0057 0.0055 2.340
45 19 44.95 49.95 47.45 901.55 42788.55 -1.55 0.0600 0.0543 23.124
50 86 49.95 54.95 52.45 4510.70 236586.22 -0.58 0.2807 0.2207 94.020
55 177 54.95 59.95 57.45 10168.65 534188.94 0.39 0.6529 0.3722 158.568
60 105 59.95 64.95 62.45 6557.25 409500.26 1.37 0.9142 0.2613 111.310
65 33 64.95 69.95 67.45 2225.85 150133.58 2.34 0.9904 0.0762 32.446
70 2 69.95 74.95 72.45 144.90 10498.01 3.32 0.9995 0.0092 3.899
75 0 74.95 79.95 77.45 0.00 0.00 4.29 1.0000 0.0005 0.195
合計 426


24678.70 1440893.57

1.0000 426.000

注:母平均母分散既知の場合には以下の方法ではなく名義尺度場合 または 順序尺度上の場合(1 標本コルモゴロフスミルノフ検定)により検定を行う。


検定手順:
  1. 前提
  2. まず最初に正規分布パラメータ推定する
    注:測定値分布正規分布あてはめるときには一般に平均母分散わからないので,以下のように標本値代用しなければならない
    1. n 個のケースが,k 個のカテゴリー分類されているとする。
      適合度の検定--正規分布への適合度の検定
      例題では,n = 426k = 9階級35〜」と「75〜」は以下の計算を行うために作られたものである)。
    2. 各階級の中心点Xi観測度数fi とする。
      例題では,測定精度0.1 kg なので,たとえば「50kg 以上 55kg 未満」という階級真の限点は 49.95kg と 54.95kg である。級中心はその中点で,52.45kg である(50kg と 55kg の中点の 52.5kg ではないことに注意)。
      適合度の検定--正規分布への適合度の検定
      1.限点・級中心の定義

    3. 与えられ度数分布表から,母平均母分散推定値 MeanVariance推定する
      適合度の検定--正規分布への適合度の検定
      適合度の検定--正規分布への適合度の検定
      例題では,表 1 の 6 列目の合計の 24678.70 を n = 426割ってMean = 57.9312,7 列目の合計の 1440893.57 を用いて Variance = 26.3528。
    4. 第 i 階級と第 i+1 階級の限点を X'i,それに対す標準化得点Zi とする。
      適合度の検定--正規分布への適合度の検定
      例題では,表 1 の 8 列目。
    5. Zi から Z < Zi となる確率 Pi求め標準正規分布表,または正規分布の上確率計算参照する),差をとることにより各階級の確率 pi = Pi - Pi-1(i = 2,3,... ,k-1)を求める。
      p1 = Pr{Z < Z1}
      pk = 1 - ( p1 + p2 + ... + pk-1 )。
      例題では,表 1 の 9,10 列目。

  3. 理論度数は,Ei = n pi となる。
    例題では,表 111 列目。
    適合度の検定--正規分布への適合度の検定
    図 2.あてはめ結果

  4. 期待値1 以下カテゴリー併合する併合後のカテゴリー数を m とする。
    例題では,表 1最初の 2 行を一つ合併し最後の 2 行を一つ合併する。m = 7 である。
  5. 以下の式で検定統計量計算する
    適合度の検定--正規分布への適合度の検定
    例題では,χ20 = 6.000 となる。
  6. χ20 は,自由度m - 1 - 2 の χ2 分布に従う(母平均母分散推定行ったため,自由度が 2 だけ余分に減る。)
    例題では,自由度7 - 1 - 2 = 4 の χ2 分布に従うことになる。
  7. 有意確率P = Pr{χ2 ≧ χ20}とする。
    χ2 分布表,または χ2 分布の上確率計算参照すること。
    例題では,自由度 4 の χ2 分布において,Pr{χ2 ≧ 9.49}= 0.05 であるからP = Pr{χ2 ≧ 6.000}> 0.05 である(正確な有意確率P = 0.199)。
  8. 帰無仮説採否決める。

    例題では,有意水準 5% で検定を行うとすれば(α = 0.05),P > α であるから帰無仮説採択する。すなわち,「正規分布に従っていないとはいえない」。





適合度の検定--順序尺度以上の場合


例題
 「テスト弁別力を高めるためには得点分布矩形であること(一様分布)が望ましいといわれる。つまり,各得点度数確率)が等しい方がよい。 表 1 はあるテスト得点分布を示すものである真の分布矩形といえるか。すなわち,各得点確率等しといえるか。」
表 1テスト得点分布
得点中心点 10 12 14 16 18 20 22 24 合計
観察度数 10 13 16 13 6 7 7 8 80



R による解析
> dosuu <- c(10, 13, 16, 13, 6, 7, 7, 8)
> ks1(dosuu)	# この関数の定義を見る
$x
[1] 10 13 16 13  6  7  7  8

$p	# 実際に適用された母比率ベクトル
[1] 0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125

$n
[1] 80

$D
[1] 0.15

$P
[1] 0.04902089	# 正確な P 値


適合度の検定--順序尺度以上の場合


例題
 「24 人の患者にある薬剤投与し,その効果調べた結果は,表 2ようになった治療効果検討するために,各患者効果判定一様に分布するかどうか検定したい。」
表 2治療効果の判定結果
 判定   悪化   不変  やや改善  改善  非常に改善  合計 
人数 2 5 4 5 8 24



R による解析
> dosuu <- c(2, 5, 4, 5, 8)
> ks1(dosuu)	# この関数の定義を見る
$x
[1] 2 5 4 5 8

$p
[1] 0.2 0.2 0.2 0.2 0.2

$n
[1] 24

$D
[1] 0.1416667

$P
[1] 0.6976136	# 正確な P 値


適合度の検定


例題
 「テスト弁別力を高めるためには得点分布矩形であること(一様分布)が望ましいといわれる。つまり,各得点度数確率)が等しい方がよい。 表 1 はあるテスト得点分布を示すものである真の分布矩形といえるか。すなわち,各得点確率等しといえるか。カイ二乗分布用い検定行え。」
表 1テスト得点分布
得点中心点 10 12 14 16 18 20 22 24 合計
観察度数 10 13 16 13 6 7 7 8 80



R による解析
> chisq.test(c(10,13,16,13,6,7,7,8), p=rep(1/8,8))

	Chi-squared test for given probabilities

data:  c(10, 13, 16, 13, 6, 7, 7, 8) 
X-squared = 9.2, df = 7, p-value = 0.2386


適合度の検定--順序尺度以上の場合


例題
 「テスト弁別力を高めるためには得点分布矩形であること(一様分布)が望ましいといわれる。つまり,各得点度数確率)が等しい方がよい。 表 1 はあるテスト得点分布を示すものである真の分布矩形といえるか。すなわち,各得点確率等しといえるか。」
表 1テスト得点分布
得点中心点 10 12 14 16 18 20 22 24 合計
観察度数 10 13 16 13 6 7 7 8 80



検定手順
  1. 前提
  2. n 個のケースが,k 個のカテゴリー分類されているとする。
    例題では,n = 80k = 8 である。
  3. 標本について累積相対度数求め理論累積相対度数との差をとる。
    累積相対度数
    階級 標本分布において 理論分布において 両者の差(di
    1 P11 P12 P11 - P12
    2 P21 P22 P21 - P22
    : : : :
    i Pi1 Pi2 Pi1 - Pi2
    : : : :
    k 1.0 1.0 0.0

    例題では,以下のような表を作る
    観察度数 相対度数 累積相対度数 理論度数 相対度数 累積相対度数 差 
    10 0.1250 0.1250 10 0.1250 0.1250 0.0000
    13 0.1625 0.2875 10 0.1250 0.2500 0.0375
    16 0.2000 0.4875 10 0.1250 0.3750 0.1125
    13 0.1625 0.6500 10 0.1250 0.5000 0.1500
    6 0.0750 0.7250 10 0.1250 0.6250 0.1000
    7 0.0875 0.8125 10 0.1250 0.7500 0.0625
    7 0.0875 0.9000 10 0.1250 0.8750 0.0250
    8 0.1000 1.0000 10 0.1250 1.0000 0.0000
    80 1.0000
    80 1.0000


  4. 両側検定場合には,差の絶対値 |di| のうち最も大きいもの dmax検定統計量とする。
    注:片側検定場合標本分布理論分布より左にある(標本での代表値理論値より小さい)場合には,累積相対度数の差 di = Pi1-Pi2 は正の値となる場合が多いと予想される累積相対度数の差のうち,最も大きいものを dmax とすれば代表値の差が大きければ大きいほど dmax大きくなる
    例題では,dmax = 0.15 である。
  5. 統計数値表(α=0.05,α=0.01)を参照して
    例題では n = 80 なので統計数値表より,有意水準 5% における棄却限界値は 0.14960 である。したがって帰無仮説棄却される。すなわち,「一様分布ていない」と結論する






適合度の検定と同じ種類の言葉


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「適合度の検定」の関連用語

適合度の検定のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



適合度の検定のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
統計学用語辞典統計学用語辞典
Copyright (C) 2024 統計学用語辞典 All rights reserved.

©2024 GRAS Group, Inc.RSS