独立性検定
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/11/17 05:00 UTC 版)
2つの変数に対する2つの観察(2x2分割表で表される)が互いに独立かどうかを検定する。例えば、「別の地域の人々について、選挙である候補を支持する頻度が違う」かどうかを検定する方法である。 カイ二乗の計算値は、確率分布が二項分布あるいは正規分布に従う集団に関しては正確にカイ二乗分布に従う。 期待値が二項分布: E = d Bin ( n , p ) {\displaystyle E=^{d}{\mbox{Bin}}(n,p)} (ただしここで、p = 帰無仮説の下での確率,n = 標本の観測値)に従う場合、カイ二乗は自由度1のカイ二乗分布に従う。なおこの二項分布は標本数が大きい場合には次のような正規分布で近似できる: Bin ( n , p ) ≈ d N ( n p , n p ( 1 − p ) ) {\displaystyle {\mbox{Bin}}(n,p)\approx ^{d}{\mbox{N}}(np,np(1-p))} 標準正規分布に従う k {\displaystyle k} 個の変数 Z {\displaystyle Z} から、各二乗の合計を求めると、自由度 k {\displaystyle k} のカイ二乗分布: ∑ i = 1 k Z i 2 = d χ k 2 {\displaystyle \sum _{i=1}^{k}Z_{i}^{2}=^{d}\chi _{k}^{2}} に従う。 しかし一般の頻度分布でもカイ二乗は「近似的には」カイ二乗分布に従うので、カイ二乗検定が適用可能である。期待値Eが小さい(標本数が小さい、または観測数が少ない)場合は、二項分布を正規分布ではうまく近似できないため、この場合には尤度比検定の1つであるG検定を用いるのがより適切である。全標本数が小さい場合は、二項検定、さらに2x2分割表で表される場合にはフィッシャーの正確確率検定を用いる必要がある。
※この「独立性検定」の解説は、「カイ二乗検定」の解説の一部です。
「独立性検定」を含む「カイ二乗検定」の記事については、「カイ二乗検定」の概要を参照ください。
- 独立性検定のページへのリンク