混同テーブル
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/08/28 07:09 UTC 版)
予測分析において、混同表(混同行列と呼ばれることもある)とは、2行2列の表で、真陽性、真陰性、偽陽性、偽陰性の数を表したものである。これにより、単なる正しい分類の割合(精度)だけでなく、より詳細な分析が可能になる。精度は、データセットが不均衡な場合、つまり、異なるクラスの観測数が大きく異なる場合、誤解を招く結果をもたらす。例えば、上記の例で極端に猫と犬の割合を変えて、猫が95匹、犬が5匹で分類をした場合、分類器によってはすべての予測を猫として分類するかもしれない。その場合、全体の精度は95% (95/100) となる。しかし、詳細を確認してみると、その分類器は猫クラスの認識率(感度)は100%だが、犬クラスの認識率は0%である。なお、F1スコア(英語版)はこのような例では低くなり97.4%以上となる。Davide ChiccoとGiuseppe Jurmanによると、混同行列を評価するための最も有益な指標は、マシューズ相関係数(MCC)(英語版)である。 一般的な混同行列は以下のように表記される。 予測クラス 実際クラス PositiveNegativePositive真陽性 (TP) 偽陰性 (FN) Negative偽陽性 (FP) 真陰性 (TN) 上記のネコの写真の分類器の例における混同行列は次のようになる。 予測クラス 実際クラス ネコネコ以外ネコ6 真陽性 (TP) 2 偽陰性 (FN) ネコ以外1 偽陽性 (FP) 3 真陰性 (TN)
※この「混同テーブル」の解説は、「混同行列」の解説の一部です。
「混同テーブル」を含む「混同行列」の記事については、「混同行列」の概要を参照ください。
- 混同テーブルのページへのリンク