SIFT以降
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/17 07:31 UTC 版)
上述したように動画像から異なる物体を認識するためには、意味的でロバストな特徴表現を動画像から得ることが重要である。回転、照明条件の違い、障害物の有無といった見た目の変化にも不変な局所的な特徴表現を学習する手法の研究が進んでいく。そうした中で2004年にスケール不変な特徴抽出手法であるSIFTが成功を収める等、研究者たちが様々な条件に不変な特徴抽出手法を提案するようになる。2001年に提案されたHaar-Like特徴(英語版)に基づくViola–Jones物体検出フレームワーク(英語版)は、主に顔検出への応用を目的とした手法で、予め作成した弱識別機を複数組み合わせ、識別器同士で互いの弱点を補い合い全体で一つの識別機を成す。但しこれらの手法のように研究者が手で特徴抽出手法を設計することについては、非常に多様な外観を持つタスクに対して完全に対処できる特徴量を得ることは難しいし、最適である保証もないとされる。
※この「SIFT以降」の解説は、「物体検出」の解説の一部です。
「SIFT以降」を含む「物体検出」の記事については、「物体検出」の概要を参照ください。
- SIFT以降のページへのリンク