評価指標
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/07/03 14:01 UTC 版)
音声認識は様々な指標を用いて性能を評価される。例えば速度は実時間係数 (real time factor, RTF)で表される。
※この「評価指標」の解説は、「音声認識」の解説の一部です。
「評価指標」を含む「音声認識」の記事については、「音声認識」の概要を参照ください。
評価指標
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/17 07:31 UTC 版)
物体検出タスクにおけるIoUの計算例。 物体検出システムの性能を測る指標としては、大きく2つの視点から挙げることができる。1つが処理速度であり、もう1つが精度である。特に処理速度を測る指標としてフレームパー毎秒(FPS)、精度を測る指標として適合率と再現率(英語版)がある。以上の指標は物体検出に限らず用いられる指標であるが、物体検出に特有の数値としてIoU(英語版)(Intersection over Union)がある。これはある推定結果と対応する正解がどの程度重なっているかを表す数値であり、完全に一致しているときには1、全く重なる部分がないときには0となる。実際の検出システムでは完全に正解と一致する結果を得ることは困難であるため、実運用評価の際にはこのIoUが一定値以上の結果を正解とみなし精度を測ることになる。また、適合率と再現率の他に、これらを組み合わせた平均適合率(Average Precision, AP)も用いられることが多い。推論時には推論した結果とともにどの程度の確からしさでその検出結果を得たかという指標も返されるが、この確からしさも用いて計算される指標である。適合率と再現率は一般にトレードオフの関係にある(後述)ため、双方の要素を取り込んだ平均適合率が使われる。 適合率(Presicion) 一般に以下の式で計算される。ここで、TPは推論結果の中で実際に正解しているもの、FPは推論結果の中で実際には正解でないものの個数である。 P r e c i s i o n = T P T P + F P {\displaystyle {\mathsf {Precision}}={\frac {TP}{TP+FP}}} 適合率は推論結果のうち正解がどれだけ含まれているか、すなわち「どれだけ正解でないものを誤って正解と検出しないか」を表す指標である。 再現率(Recall) 一般に以下の式で計算される。ここで、FNは検出しなかったものの実際には正解であるような見逃した個数を表す。 R e c a l l = T P T P + F N {\displaystyle {\mathsf {Recall}}={\frac {TP}{TP+FN}}} 再現率は全ての正解として扱われるべきものの中で実際にどれだけ推論できたか、すなわち「どれだけ正解を見逃さなかったか」を表す指標である。式からも明らかであるが、見逃しを減らすためにより多くのものを検出しようとすればするほど再現率は高まるが、その分本来正解でないものを正解としてしまうパターンが増えるため適合率は下がりがちである。他方で、過検出を減らすために検出結果を絞り込むと適合率は高まるが、その分本来正解であるべきものを見逃すパターンが増えるため再現率は下がりがちである。すなわち、適合率と再現率はトレードオフの関係にある。
※この「評価指標」の解説は、「物体検出」の解説の一部です。
「評価指標」を含む「物体検出」の記事については、「物体検出」の概要を参照ください。
- 評価指標のページへのリンク