コンピュータステレオビジョン
コンピュータステレオビジョン(英: Computer stereo vision、計算機立体視)は、CCDカメラによって得られるようなデジタル画像から三次元(3D)情報を抽出する技術である。2つの視点から見た光景の情報を比較することによって、2つのパネルに写っている物体の相対的な位置を調べることで、3D情報を抽出することができる。これは生物学的な過程である「立体視」に似ている。
概要
従来のステレオビジョンでは,人間の両眼視と同じように,ある光景の異なる2つの視点を得るために水平方向に配置された2台のカメラが用いられる。これらの2つの画像を比較することによって、相対的な奥行き情報を、対応する画像点の水平座標の差を符号化した視差マップの形で得ることができる。この視差マップの値は、対応するピクセル位置での光景の深さに反比例する。
人間が2つの映像を比較するためには、立体視装置で重ね合わせ、右のカメラの映像は観察者の右目に、左のカメラの映像は左目に見せる必要がある。
コンピュータビジョンシステムでは、いくつかの前処理工程が必要である[1]。
- 画像はまず、たる型歪みと接線歪みが除去されていなければならない。これにより、観測された画像が理想的なピンホールカメラの投影と一致するようになる。
- 画像のペアを比較するためには、画像を共通の平面に戻して投影しなければならない(画像の平行化)。
- 2つの画像を比較する情報量を最小化する。これにより、2つの画像内の特徴の位置が最もよく推定され、視差マップが作成される。
- 任意で、受信した視差マップを3D点群に投影する。カメラの投影パラメータを利用することで、既知のスケールでの測定値を提供するように点群を計算することができる。
能動ステレオビジョン
能動(アクティブ)ステレオビジョンは、ステレオマッチング問題を単純化するために、レーザーや構造化光といった光を積極的に利用するステレオビジョンの形態である。対義語は受動(パッシブ)ステレオビジョンである。
- 従来型構造化光ビジョン
- 従来型の構造化光ビジョン(structured-light vision, SLV)は構造化光やレーザーを用いて、プロジェクターとカメラの対応関係を求める[2][3]。
- 従来型能動ステレオビジョン
- 従来型の能動(アクティブ)ステレオビジョン(active stereo vision, ASV)は構造化光やレーザーを利用するが、ステレオマッチングは受動ステレオビジョンと同じやり方で、カメラ–カメラ対応のためだけに実行される。
- 構造化光ステレオ
- 構造化光ステレオ(structured-light stereo, SLS)は、カメラ-カメラ対応とプロジェクタ-カメラ対応の両方を利用するハイブリッド型である[4]。
応用
3Dステレオディスプレイは、エンターテインメント、情報伝達、自動化システムなど様々な分野で利用されている。ステレオビジョンは、ロボット工学などの分野において、自律システムの周辺にある3次元物体の相対的な位置に関する情報を抽出するために非常に重要である。ロボット工学への応用としては、物体認識がある[5]。奥行き情報を利用することで、ロボットが他の基準では別の物体として識別できないような、1つの椅子が別の椅子の前にあるような、隠蔽された画像要素をシステムが分離することができる。
デジタルステレオビジョンの科学的な応用としては、航空測量からの情報抽出、等高線図の算出、さらには3Dビルマッピングのための幾何形状抽出、写真測量による衛星マッピング、NASAのSTEREOプロジェクトで得られたような3D太陽情報の算出などが挙げられる。
詳細な定義

画素はある位置の色を記録する。位置は、ピクセルのグリッド内の位置(x、y)とピクセルzまでの深さによって識別される。
立体視では、同じシーンを異なる位置から見た2つの画像を得ることができる。右図では、点Aからの光が、BとDのピンホールカメラの入口を通って、EとHの画像スクリーンに照射されている。
右図では、2つのカメラレンズの中心間の距離は、BD = BC + CDとなっています。以下の三角形の対は相似の関係にある。
- ACBとBFE
- ACDとDGH
したがって、変位dは
- コンピュータステレオビジョンのページへのリンク