古典的な機械学習によるアプローチ
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/17 07:31 UTC 版)
「物体検出」の記事における「古典的な機械学習によるアプローチ」の解説
先述したように、古典的な機械学習をベースにしたアプローチでは、まず画像から特徴量を抽出し、その特徴量を用いてマッチングを行うなどして物体を検出する。以下では特に検出手法について断りがない限り、前者の「画像から特徴量を抽出する」手法について述べている。 Haar-Like特徴(英語版)に基づくViola–Jones物体検出フレームワーク(英語版) Haar-Like特徴量は2001年に提案された、主に顔検出(英語版)に用いられる特徴量である。矩形領域内の平均輝度の差に基づく特徴量で、人間の顔の場合は一般的に鼻筋や頬が明るく、逆に目や口は暗いという共通の特徴があることに着目し、これを捉えるために画像内の明暗の差を特徴としたものである。この特徴を用いた単純な識別器を大量に生成、選別し、それらをカスケード状に接続(直列に接続すること)して顔の位置を検出する手法がHaar-Like特徴と同時に提案されている。 スケール不変特徴量変換 (SIFT)(英語版) 画像のスケール変換や回転に不変な特徴量を抽出する手法。特徴点を検出するキーポイント検出と、検出された特徴点に対し回転不変な特徴量を記述する特徴量記述の二段構成になっている。SIFTの発表後、SIFTが抱える課題を解決するための派生手法が複数提案され、処理の高速化・省メモリ化が図られている。 HOG特徴量(英語版) 2005年に提案された、人に共通する特徴を捉えるための特徴量。SIFT同様一定領域まわりの輝度勾配に基づく特徴量であるが、SIFTが特徴点に着目するのに対しHOG特徴量は領域矩形内の輝度勾配を用いるため物体形状を表現することが可能であり、人検出(英語版)に限らず用いられている。
※この「古典的な機械学習によるアプローチ」の解説は、「物体検出」の解説の一部です。
「古典的な機械学習によるアプローチ」を含む「物体検出」の記事については、「物体検出」の概要を参照ください。
- 古典的な機械学習によるアプローチのページへのリンク