適合度検定
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/11/17 05:00 UTC 版)
観測された度数分布が理論分布と同じかどうかを検定する。例えば簡単な例として、標本として100人の人がいる場合に、「男と女が同数だけいる集団から、ランダムに抽出された100人である」という仮説を検定するには、男女の人数の観測度数と期待度数とを比較すればよい。観測値が男45人、女55人ならば、 i属性 Si観測度数 νi期待確率 pi期待度数 npi(νi − npi)2/npi1男性 45 1/2 50 25/50 2女性 55 1/2 50 25/50 計 n = 100 1 100 χ2 = 1 χ 2 = ∑ i ( ν i − n p i ) 2 n p i = ( 45 − 50 ) 2 50 + ( 55 − 50 ) 2 50 = 1 {\displaystyle \chi ^{2}=\sum _{i}{\frac {(\nu _{i}-np_{i})^{2}}{np_{i}}}={(45-50)^{2} \over 50}+{(55-50)^{2} \over 50}=1} この場合の自由度は1である(2つの観測値と理論値の差は、一方を決めると他方も自動的に決まるから)。そこで自由度1のカイ二乗分布を見ると、男女の人数が等しい場合にこのような差(及び女がさらに多くなるような場合)が見出される確率は、おおよそ0.32である。この確率は普通用いる統計学的有意水準( α = 0.05, 0.01など)よりも高いから、「男女の人数が等しい」とする帰無仮説を棄却する理由がない。 またカイ二乗分布で十分近似できるのは、実際的な問題として期待度数が条件 npi ≥ 10 をすべての属性に対して満たすときとされている。
※この「適合度検定」の解説は、「カイ二乗検定」の解説の一部です。
「適合度検定」を含む「カイ二乗検定」の記事については、「カイ二乗検定」の概要を参照ください。
- 適合度検定のページへのリンク