混同行列とは? わかりやすく解説

混同行列

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/10/15 03:25 UTC 版)

機械学習の分野、特に統計的分類の問題において、混同行列(こんどうぎょうれつ、: confusion matrix)は、アルゴリズムの性能を可視化するための特有の表配置である。誤差行列(: error matrix)とも呼ばれる。通常は教師あり学習で使用される(教師なし学習では通常、マッチング行列と呼ばれる)。行列の行方向は実際のクラス(部分集合)のインスタンス(実体)を表し、列方向はモデルで予測されたクラスのインスタンスを表す[1]が、その逆の場合もある[2]

これは特別な種類の分割表で、2つの次元(「実際」と「予測」)と、両方の次元で同一の「クラス」のセットからなる(次元とクラスの各組み合わせは分割表の変数である)。

混同行列の例

例として、ネコの写真が8枚、イヌの写真が4枚の計12枚の写真がサンプルとして与えられ、ネコがクラス1に、イヌがクラス0に属するとする。

この例では、正解となる実際の値を

実際 = [1,1,1,1,1,1,1,1,0,0,0,0] と表示することができる。

ここで、ネコとイヌを区別する分類器で学習したと仮定して、この12枚の写真を分類器にかける。この分類器は9つの写真で正確な予測を行い、以下の3つの予測を外したとする。

予測結果 = [0,0,1,1,1,1,1,1,0,0,0,1]

この予測結果では以下のことがわかる。

  1. 最初の2匹のネコがイヌと間違って予測
  2. 最後の1匹のイヌがネコと間違って予測

この2つのラベル付きのデータセット(実際と予測)を使って、分類器で予測した結果をまとめた混同行列は以下の通りとなる。

予測
実際
ネコ イヌ
ネコ 6 2
イヌ 1 3

この混同行列では、8枚のネコの写真のうち、2枚をイヌと判断し、4枚のイヌの写真のうち、1枚をネコと予測している。正しい予測ができた数が表の対角線上に位置しており(太字で表示)、対角線から外れた部分に誤判定の数を表示している[2]。 混同行列により、分類結果を簡単かつ視覚的に表すことが可能である[3]

混同テーブル

予測分析において、混同表混同行列と呼ばれることもある)とは、2行2列の表で、真陽性、真陰性、偽陽性、偽陰性の数を表したものである。これにより、単なる正しい分類の割合(精度)だけでなく、より詳細な分析が可能になる。精度は、データセットが不均衡な場合、つまり、異なるクラスの観測数が大きく異なる場合、誤解を招く結果をもたらす。例えば、上記の例で極端に猫と犬の割合を変えて、猫が95匹、犬が5匹で分類をした場合、分類器によってはすべての予測を猫として分類するかもしれない。その場合、全体の精度は95% (95/100) となる。しかし、詳細を確認してみると、その分類器は猫クラスの認識率(感度)は100%だが、犬クラスの認識率は0%である。なお、F1スコア英語版はこのような例では低くなり97.4%以上となる。Davide ChiccoとGiuseppe Jurmanによると、混同行列を評価するための最も有益な指標は、マシューズ相関係数(MCC)英語版である[4]

一般的な混同行列は以下のように表記される。

予測クラス
実際クラス
Positive Negative
Positive 真陽性 (TP) 偽陰性 (FN)
Negative 偽陽性 (FP) 真陰性 (TN)


上記のネコの写真の分類器の例における混同行列は次のようになる。

予測クラス
実際クラス
ネコ ネコ以外
ネコ 6 真陽性 (TP) 2 偽陰性 (FN)
ネコ以外 1 偽陽性 (FP) 3 真陰性 (TN)

多クラスにおける混同行列

混同行列は二値分類に限らず、3つ以上の分類でも利用できる[5]。以下の例は、2者間の口笛言語によるコミュニケーションをまとめたもので、母音5種類のクロス表である。わかりやすさのため、0を省略している[6]

知覚された
母音
発音した
母音
i e a o u
i 15 1
e 1 1
a 79 5
o 4 15 3
u 2 2


脚注

  1. ^ Powers, David M. W. (2011). “Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation”. Journal of Machine Learning Technologies 2 (1): 37–63. https://www.researchgate.net/publication/228529307. 
  2. ^ a b Labatut & Cherifi 2011, p. 23.
  3. ^ gregorybchris. “AutoML 実験結果の評価 - Azure Machine Learning”. docs.microsoft.com. 2021年8月23日閲覧。
  4. ^ Chicco, D.; Jurman, G. (2020). “The advantages of the Matthews correlation coefficient (MCC) over F1 score and accuracy in binary classification evaluation”. BMC Genomics 21 (1): 6. doi:10.1186/s12864-019-6413-7. PMC 6941312. PMID 31898477. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6941312/. 
  5. ^ Piryonesi S. Madeh; El-Diraby Tamer E. (2020-03-01). "Data Analytics in Asset Management: Cost-Effective Prediction of the Pavement Condition Index". Journal of Infrastructure Systems. 26 (1): 04019036. doi:10.1061/(ASCE)IS.1943-555X.0000512
  6. ^ Rialland, Annie (August 2005). “Phonological and phonetic aspects of whistled languages”. Phonology 22 (2): 237–271. doi:10.1017/S0952675705000552. 

参考文献

  • Labatut, Vincent; Cherifi, Hocine (2011). “Evaluation of Performance Measures for Classifiers Comparison”. Ubiquitous Computing and Communication Journal 6: 21-34. 

混同行列

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/02/01 02:38 UTC 版)

統計学および機械学習の評価指標」の記事における「混同行列」の解説

詳細は「混同行列(英語版)」を参照 実際の値正負予測正真陽性True Positive(TP) 偽陽性False Positive(FP) 負偽陰性False Negative(FN) 真陰性True Negative(TN) scikit-learnではmetricsモジュールの「confusion_matrix(y_true, y_pred)」。

※この「混同行列」の解説は、「統計学および機械学習の評価指標」の解説の一部です。
「混同行列」を含む「統計学および機械学習の評価指標」の記事については、「統計学および機械学習の評価指標」の概要を参照ください。

ウィキペディア小見出し辞書の「混同行列」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「混同行列」の関連用語

混同行列のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



混同行列のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの混同行列 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの統計学および機械学習の評価指標 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS