マハラノビスの平方距離
マハラノビスの平方距離に基づき,距離の近い群に判別するということを,架空例で見てみよう。
表 1. 2群,2変量データ | 2 群のデータを考える。各群 10 組の2 変数データとする。データは表 1 の通り。 第 2 群のデータは,第 1 群のデータを (100, 50) だけ平行移動したものである。 第 1 群の平均値は (59, 64),第 2 群の平均値は (159, 114) である。 |
表 2. 変動・共変動の計算 | 変動・共変動の計算は,表 2 のようになる。第 1 群と第 2 群の分散・共分散行列は全く等しいことに注意。 分散・共分散行列および,その逆行列を計算する。 |
図 1. マハラノビスの平方距離の計算例 | マハラノビスの平方距離は,分散共分散行列の逆行列を用いて計算する。 第 1 群の 10 番目の例 (111, 134) について,各群の重心までマハラノビスの平方距離の計算例を図 1 に示す。 |
図 2. マハラノビスの平方距離とユークリッド距離の関係 | この結果を図 2 に示す。ユークリッド距離では,緑で描いた線分は紫で描いた線分より長い(距離が長い)。しかし,第 1 群の重心までのマハラノビス距離は 3.53,第 2 群の重心までのマハラノビス距離は 13.03 である。その理由は,各群のデータは楕円で示したような二次元(正規分布)をしているので,ユークリッド距離的に楕円の長軸方向と短軸方向へ同じだけ離れた点までのマハラノビス距離は異なるのである(短軸方向の距離の方が長い)。 |
第 1 群の 10 番目の例 (111, 134) は,第 1 群までの平方距離が 3.528831972,第 2 群までの平方距離が 13.02910706 であり,p = 2 であるから,各群に属する確率はそれぞれ CHIDIST(3.528831972,2)=0.1712867911712320,CHIDIST(13.02910706,2)=0.0014817172941941 となる。
このデータを判別分析した結果例を以下に示す。
★ 平均値 全体 第1群 第2群 20ケース 10ケース 10ケース 2 Var002 109.0000 59.00000 159.0000 3 Var003 89.00000 64.00000 114.0000 ★ 判別関数 判別係数 標準化判別係数 2 Var002 -0.21312 -12.43133 3 Var003 0.11503 4.99000 定数項 12.99238 ★ 各ケースの判別結果 ケース R P 平方距離1 平方距離2 判別値 1 1 1 2.75(0.253) 27.59(0.000) 12.42079 2 1 1 0.97(0.616) 20.61(0.000) 9.81963 3 1 1 3.07(0.216) 10.15(0.006) 3.54106 4 1 1 2.06(0.357) 28.76(0.000) 13.35170 5 1 1 0.01(0.993) 15.51(0.000) 7.74637 6 1 1 1.25(0.536) 8.67(0.013) 3.71402 7 1 1 0.12(0.940) 14.41(0.001) 7.14444 8 1 1 2.74(0.254) 26.91(0.000) 12.08365 9 1 1 1.50(0.473) 7.96(0.019) 3.23069 10 1 1 3.53(0.171) 13.03(0.001) 4.75014 図 1 の計算例に示したもの 11 2 2 9.03(0.011) 2.75(0.253) -3.13971 12 2 2 12.45(0.002) 0.97(0.616) -5.74086 13 2 2 27.11(0.000) 3.07(0.216) -12.01944 14 2 2 6.48(0.039) 2.06(0.357) -2.20880 15 2 2 15.64(0.000) 0.01(0.993) -7.81413 16 2 2 24.94(0.000) 1.25(0.536) -11.84647 17 2 2 16.96(0.000) 0.12(0.940) -8.41605 18 2 2 9.70(0.008) 2.74(0.254) -3.47685 19 2 2 26.16(0.000) 1.50(0.473) -12.32981 20 2 2 25.15(0.000) 3.53(0.171) -10.81036 注:‘平方距離'は各群の重心までのマハラノビスの平方距離 カッコ内は各群に属する確率 ★ 判別結果 判別された群 実際の群 第1群 第2群 合計 第1群 10 0 10 % (100.0) ( 0.0) (100.0) 第2群 0 10 10 % ( 0.0) (100.0) (100.0) 正判別率 ・・・ 100.00%
- マハラノビスの平方距離のページへのリンク