MNISTによる性能評価の歴史
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/07/24 16:39 UTC 版)
「MNISTデータベース」の記事における「MNISTによる性能評価の歴史」の解説
2012年に発表された研究では、ニューラルネットワークを組み合わせるコミッティマシン(英語版)を用いて、MNISTデータベースで「人間に近いパフォーマンス」を達成した。同じ論文で、他の認識タスクでも人間の2倍のパフォーマンスを達成している。MNISTデータベースのWebサイトにアップされている一覧によれば、最も悪い誤検知率は12%である。これは、データの前処理をすることなく単純な線形分類器を使用して分類した場合に記録されたものである。 2004年には、ローゼンブラットのパーセプトロン原理に基づく3つのニューロン層を持つニューラル分類器であるLIRAと呼ばれる新しい分類器を用いて、MNISTデータベースにおいて0.42%という最良の誤検知率が達成された。 研究者によっては、ランダムな歪み加工を施したデータを用いて人工知能を学習・評価したものもある。対象となるシステムは通常ニューラルネットワークであり、使用される歪み加工はアフィン変換または弾性変形のいずれかであることが多い。この方法で学習されたモデルが高い精度を達成する場合もある。その中の事例の一つでは、MNISTデータベースを用いた評価で誤検知率0.39%を達成した。 2011年には、従来の最良の結果を改善して誤検知率0.27%を達成したことが、同様のニューラルネットワークを用いた研究で報告された。2013年には、DropConnectと呼ばれる正則化手法を用いたニューラルネットワークで、誤検知率0.21%を達成したとする研究も現れた。2016年時点で、単一の畳み込みニューラルネットワーク(CNN)を用いた実験に限ると、誤検知率0.25%が最も良い。また2018年8月時点で、データ拡張(英語版)を使用せずにMNISTで学習した単一の畳み込みニューラルネットワークの最高精度もまた、誤検知率0.25%である。単一のCNNに限らなければ、Parallel Computing Center(ウクライナのフメリニツキー)が、5つのCNNを用いたアンサンブル学習により誤検知率0.21%を達成している。2018年には、バージニア大学の研究者が、3種類のニューラルネットワーク(fully connected, recurrent, convolutional)を並列させたネットワークを用いて誤検知率0.18%を達成したと発表している。なお、テストデータセット内の画像にはほとんど読み取れないような識別難度の高いものも含まれている。
※この「MNISTによる性能評価の歴史」の解説は、「MNISTデータベース」の解説の一部です。
「MNISTによる性能評価の歴史」を含む「MNISTデータベース」の記事については、「MNISTデータベース」の概要を参照ください。
- MNISTによる性能評価の歴史のページへのリンク