関連性の尺度
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/12/02 00:28 UTC 版)
2つの変数の関連性の度合いは、いくつかの係数で評価できる。最も単純な係数として以下のように定義されるファイ係数がある。 ϕ = χ 2 N {\displaystyle \phi ={\sqrt {\frac {\chi ^{2}}{N}}}} ここで、χ2 はピアソンのカイ二乗検定で得られる値、N は観測の総計である。φは0(変数間には全く関係がない)から1(変数間には完全な関係がある)までの値をとる。この係数は2×2分割表でのみ使える。他にも、テトラコリック相関係数(これも2×2分割表でのみ利用可能)、C係数 (contingency coefficient)、クラメールのV係数などがある。C係数は、非対称な表(行数と列数が同じでない表)では完全な相関であっても最大値が1にならないという欠点がある。テトラコリック相関係数は2つの変数が正規分布の場合のピアソンの確率相関係数であり、確率変数の分布を適切な割合で2つのカテゴリに分類することで、観測された分割表を再現することができる。セルに 0 と 1 という値を割り当てて計算されるピアソンの確率相関係数と混同すべきではない。各変数が3つ以上の値をとる場合の表についての同様の量を多分相関係数と呼ぶ。 他の係数は次のような式で表される。 C = χ 2 N + χ 2 {\displaystyle C={\sqrt {\frac {\chi ^{2}}{N+\chi ^{2}}}}} V = χ 2 N ( k − 1 ) {\displaystyle V={\sqrt {\frac {\chi ^{2}}{N(k-1)}}}} k は列数または行数の少ないほうである。 C は、行と列が任意個の表であっても k − 1 k {\displaystyle {\sqrt {\frac {k-1}{k}}}} で割ることで完全な相関があるときに最大値が1になるようにできる。
※この「関連性の尺度」の解説は、「分割表」の解説の一部です。
「関連性の尺度」を含む「分割表」の記事については、「分割表」の概要を参照ください。
- 関連性の尺度のページへのリンク