判別分析
判別分析 discriminant analysis
判別分析
判別分析の目的は,いくつかの変数に基づいて,各データがどの群に所属するかを判定することである。
単純にするために,データが 2 つの群に分けられており,それぞれ 2 個の変数 x1,x2 の値が観察されているとする。
x1 あるいは x2 においてデータの分布を描くと,図 1 のように 2 群が重なる部分が大きいことがわかる。
ここで図に示したような座標軸 f を考えると,各データがこの座標軸上でとる値は,
f = a x1 + b x2
のように合成変数の形になることがわかる。
図 1.判別分析の概念図 |
---|
座標軸 f 上でのデータの分布を描くと,各群の重なる部分が小さくなることがわかる。これは,座標軸 f 上で,ある値より大きい値であるか小さい値であるかによって,そのデータがいずれの群に属するかを判定できることを意味する。
判別分析
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/12/28 00:43 UTC 版)
判別分析(はんべつぶんせき、英: discriminant analysis)は、事前に与えられているデータが異なるグループに分かれる場合、新しいデータが得られた際に、どちらのグループに入るのかを判別するための基準(判別関数[注釈 1])を得るための正規分布を前提とした分類の手法。英語では線形判別分析[注釈 2]をLDA、二次判別分析[注釈 3]をQDA、混合判別分析[注釈 4]をMDAと略す。1936年にロナルド・フィッシャーが線形判別分析を発表し[1][2]、1996年に Trevor Hastie, Robert Tibshirani が混合判別分析を発表した[3]。
- ^ 英: discriminant function
- ^ 英: linear discriminant analysis
- ^ 英: quadratic discriminant analysis
- ^ 英: mixture discriminant analysis
- ^ 英: multiple discriminant analysis
- ^ 英: linear discriminant function
- ^ 英: quadratic discriminant function
- ^ 英: nonlinear discriminant function
- ^ 英: multivariate normal distribution
- ^ 英: Mahalanobis' generalized distance
- ^ この文脈中には総和を表すシグマ記号「」もあるが、それとは異なるので注意。
- ^ FISHER, R. A. (September 1936). “The use of multiple measurements in taxonomic problems”. Annals of Eugenics 7 (2): 179–188. doi:10.1111/j.1469-1809.1936.tb02137.x.
- ^ Cohen et al. Applied Multiple Regression/Correlation Analysis for the Behavioural Sciences 3rd ed. (2003). Taylor & Francis Group.
- ^ Trevor Hastie; Robert Tibshirani (1996). “Discriminant Analysis by Gaussian Mixtures”. Journal of the Royal Statistical Society, Series B 58 (1): 155-176.
- ^ Trevor Hastie, Robert Tibshirani, Jerome Friedman『統計的学習の基礎 ―データマイニング・推論・予測―』共立出版、2014年6月25日。ISBN 978-4320123625。
- 判別分析のページへのリンク