コンピューター‐ビジョン【computer vision】
コンピュータビジョン
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/03/20 16:46 UTC 版)
![]() |
この記事は英語版の対応するページを翻訳することにより充実させることができます。(2023年12月)
翻訳前に重要な指示を読むには右にある[表示]をクリックしてください。
|
![]() |
人工知能 |
---|
![]() |
コンピュータビジョン(computer vision)はコンピュータがデジタルな画像、または動画をいかによく理解できるか、ということを扱う研究分野である。工学的には、人間の視覚システムが行うことができるタスクを自動化することを追求する分野である。
この分野はコンピュータが実世界の情報を取得する全ての過程を扱うため、画像センシングのためのハードウェアから情報を認識するための人工知能的理論まで幅広く研究されている。また、近年[いつ?]ではコンピュータグラフィックスとコンピュータビジョンの融合が注目を集めている。
研究対象を大別すると、
- 画像センサ
- カメラ
- レンジファインダ
- 2次元画像処理
- 3次元画像処理
- ステレオ法(コンピュータステレオビジョン)
- エピポーラ幾何
- Shape from X
- 因子分解法 (factorization)
- 認識・識別
- 情報提示
が挙げられる。
これらの技術はロボットビジョン、ウェアラブルコンピュータなどとも深く結びついている。
また、背景知識として信号処理、線型代数などが要求される。人間の目と脳に匹敵するコンピュータビジョンの開発はAI完全な問題とされている。
関連項目
- OpenCV - オープンソースの汎用的なコンピュータビジョンライブラリ。様々な画像処理が標準機能として実装されている。
- Matrox Imaging Library
- 情報学
- マシンビジョン
- 物体認識
- 視覚と自然言語の融合研究 - コンピュータビジョンと自然言語処理の融合分野
外部リンク
- 画像処理ポータル 画像機器総覧 画像機器総覧は画像処理に関連する製品、技術情報を紹介しているポータルサイト
- CVPR
- ICCV2007
- PAMI
- 数分でComputer Vision を概観
コンピュータビジョン
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/09/06 10:18 UTC 版)
「クリフォード代数」の記事における「コンピュータビジョン」の解説
最近、クリフォード代数はコンピュータビジョンにおける action recognition と分類の問題において応用されている。Rodriguez et al. は伝統的な MACH filters を video (3D spatiotemporal volume) とオプティカルフローのようなベクトル値データに一般化するクリフォード埋め込みを提案する。ベクトル値データは Clifford Fourier Transform を用いて解析される。これらのベクトルに基づいてアクションフィルターはクリフォードフーリエドメインにおいてシンセサイズされアクションの認識は Clifford Correlation を用いて実行される。著者は古典的特徴フィルムとスポーツ報道テレビにおいて典型的に実行されるアクションを認識することによってクリフォード埋め込みの有効性を説明する。
※この「コンピュータビジョン」の解説は、「クリフォード代数」の解説の一部です。
「コンピュータビジョン」を含む「クリフォード代数」の記事については、「クリフォード代数」の概要を参照ください。
固有名詞の分類
- コンピュータ・ビジョンのページへのリンク