線形判別分析
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2017/04/14 16:02 UTC 版)
線形判別関数は以下の通り。これの正負で判断。 x {\displaystyle x} は入力、 μ {\displaystyle \mu } は平均、 Σ {\displaystyle \mathbf {\Sigma } } は共分散行列。この式は多変量正規分布の式より導出できる。 ( x − μ f i r s t + μ s e c o n d 2 ) T Σ − 1 ( μ f i r s t − μ s e c o n d ) {\displaystyle \left(x-{\frac {\mu _{\rm {first}}+\mu _{\rm {second}}}{2}}\right)^{T}\mathbf {\Sigma } ^{-1}(\mu _{\rm {first}}-\mu _{\rm {second}})} より細かく、線形判別関数 ( y = ∑ i = 1 n a i x i + a 0 {\displaystyle y=\sum _{i=1}^{n}a_{i}x_{i}+a_{0}} ) の求め方を以下に示す。 第一群、第二群についてそれぞれ積和を求める。 W i j = Σ i j ( x i − x ) ( x j − x ) {\displaystyle W_{ij}=\Sigma _{ij}(x_{i}-x)(x_{j}-x)} 第一群と第二群の平方和・積和を、同じ2変数について足し、自由度 N f i r s t + N s e c o n d − 2 {\displaystyle N_{\rm {first}}+N_{\rm {second}}-2} で除す。 S i j = W i j ( f i r s t ) + W i j ( s e c o n d ) N f i r s t + N s e c o n d − 2 {\displaystyle S_{ij}={\frac {W_{ij}{\rm {(first)}}+W_{ij}{\rm {(second)}}}{N_{\rm {first}}+N_{\rm {second}}-2}}} S i j {\displaystyle S_{ij}} を、その i {\displaystyle i} 行 j {\displaystyle j} 列に対応させて分散共分散行列 S {\displaystyle {\mathbf {S} }} とし、各変数にかかる係数を n {\displaystyle n} 行 1 {\displaystyle 1} 列に並べた行列を A {\displaystyle {\mathbf {A} }} 、第一群の各変数の平均値から第二群の各変数を引いた数 x i ( f i r s t ) − x i ( s e c o n d ) {\displaystyle x_{i}{\rm {(first)}}-x_{i}{\rm {(second)}}} を n {\displaystyle n} 行 1 {\displaystyle 1} 列に並べた行列を X {\displaystyle {\mathbf {X} }} とすると以下の式が成り立つ。 S A = X {\displaystyle {\mathbf {S} }{\mathbf {A} }={\mathbf {X} }} ゆえに A = S − 1 X {\displaystyle {\mathbf {A} }={\mathbf {S} }^{-1}{\mathbf {X} }} これにより各変数にかかる係数を求めることができる。定数項は、 a 0 = − 1 2 ∑ i = 1 n a i { x i ( f i r s t a v e r a g e ) + x i ( s e c o n d a v e r a g e ) } {\displaystyle a_{0}=-{\frac {1}{2}}\sum _{i=1}^{n}a_{i}\left\{x_{i}{\rm {(firstaverage)}}+x_{i}{\rm {(secondaverage)}}\right\}} 判別得点 y {\displaystyle y} が正のとき第一群、負のとき第二群と判別される。変数が標準化されていれば、係数の大きさは、そのままその変数が判別に与える影響の大きさである。 変数が定性的な場合は、ダミー変数を用いる。 y = ∑ i = 1 n ( a i ( f i r s t ) x i ( f i r s t ) + a i ( s e c o n d ) x i ( s e c o n d ) ) + a 0 {\displaystyle y=\sum _{i=1}^{n}\left(a_{i}{\rm {(first)}}x_{i}{\rm {(first)}}+a_{i}{\rm {(second)}}x_{i}{\rm {(second)}}\right)+a_{0}} ここに、 x i j {\displaystyle x_{ij}} : x i {\displaystyle x_{i}} の j {\displaystyle j} 番目のカテゴリーに反応するとき 1 {\displaystyle 1} 、しないとき 0 {\displaystyle 0} 。
※この「線形判別分析」の解説は、「判別分析」の解説の一部です。
「線形判別分析」を含む「判別分析」の記事については、「判別分析」の概要を参照ください。
- 線形判別分析のページへのリンク