テキスト認識とは? わかりやすく解説

テキスト認識

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/18 18:37 UTC 版)

光学文字認識」の記事における「テキスト認識」の解説

中核となる OCR アルゴリズムには以下の 2 つ基本的な種類があり、候補文字ランク付けされたリスト生成するマトリックスマッチング 画像ピクセル単位格納されグリフ比較する。"パターンマッチング"、"パターン認識"、"デジタル画像相関"ともいわれる技術である。これは、入力グリフイメージ残り部分から正しく分離されていることと、格納されているグリフが同じフォントで同じスケールであることに依存するこの方法は、同一活字入力する最適に機能し途中で新しフォント出てくる場合はうまく機能しない。これは、初期物理写真セルベースOCR実装した技術である。 特徴検出 グリフ線分閉じたループ、線の方向、線の交差などの “フィーチャ(特徴)” に分解される検出機能は、表現の次元性を低下させ、認識プロセス計算効率的にする。これらのフィーチャは、文字抽象的なベクトルのような表現比較され1つ上のグリフプロトタイプに縮小されるコンピュータビジョンにおける特徴検出一般的なテクニックは、一般的にインテリジェント手書き文字認識実際に最も近代的なOCRソフトウェア使われる。k近傍アルゴリズムなどの最も近い近隣分類子は、画像フィーチャと格納されているグリフフィーチャを比較し最も近い一致選択するCuneiformTesseractなどのソフトウェアは、文字認識に2パス法使用する2番目のパスは「適応認識」と呼ばれ最初パスで高い信頼得て認識され文字形状使用して2番目のパス残り文字より良く認識する。これは、特殊なフォントフォント歪んでいる(例えば、ぼやけた、またはフェードされている)低品質スキャンされた画像に有利である。 OCRopus や Tesseractのような最近OCR ソフトウェアは、単一文字焦点当てるではなくテキストの行全体認識するように訓練されニューラルネットワーク使用する反復 OCR呼ばれる新しい手法では、ページ レイアウト基づいて文書自動的にセクション切り取るOCR は、ページレベルの OCR 精度最大化するために、可変文字信頼レベルしきい値使用してセクションに対して個別実行されるOCR結果は、標準化されALTO形式米国議会図書館によって管理される専用XML スキーマ格納されるその他の一般的な形式は、hOCR と PAGE XML である。

※この「テキスト認識」の解説は、「光学文字認識」の解説の一部です。
「テキスト認識」を含む「光学文字認識」の記事については、「光学文字認識」の概要を参照ください。

ウィキペディア小見出し辞書の「テキスト認識」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「テキスト認識」の関連用語

テキスト認識のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



テキスト認識のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの光学文字認識 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2024 GRAS Group, Inc.RSS