テキスト認識とは？わかりやすく解説

辞書 類語・対義語辞典 英和・和英辞典 日中中日辞典 日韓韓日辞典 古語辞典

その他の辞書▼
- フランス語辞典
- インドネシア語辞典
- タイ語辞典
- ベトナム語辞典

Weblio 辞書ヘルプ

556の専門辞書や国語辞典百科事典から一度に検索!

無料の翻訳ならWeblio翻訳！

初めての方へ参加元一覧

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > テキスト認識の意味・解説

ウィキペディア小見出し辞書

索引トップ用語の索引ランキング

テキスト認識

出典: フリー百科事典『ウィキペディア（Wikipedia）』 (2022/05/18 18:37 UTC 版)

「光学文字認識」の記事における「テキスト認識」の解説

中核となる OCR アルゴリズムには以下の 2 つの基本的な種類があり、候補文字のランク付けされたリストを生成する。マトリックスマッチング画像をピクセル単位で格納されたグリフと比較する。"パターンマッチング"、"パターン認識"、"デジタル画像相関"ともいわれる技術である。これは、入力グリフがイメージの残りの部分から正しく分離されていることと、格納されているグリフが同じフォントで同じスケールであることに依存する。この方法は、同一活字を入力すると最適に機能し、途中で新しいフォントが出てくる場合はうまく機能しない。これは、初期の物理写真セルベースのOCRが実装した技術である。特徴検出グリフが線分、閉じたループ、線の方向、線の交差などの “フィーチャ（特徴）” に分解される。検出機能は、表現の次元性を低下させ、認識プロセスを計算上効率的にする。これらのフィーチャは、文字の抽象的なベクトルのような表現と比較され、1つ以上のグリフプロトタイプに縮小される。コンピュータビジョンにおける特徴検出の一般的なテクニックは、一般的にインテリジェント手書き文字認識と実際に最も近代的な OCR ソフトウェアで使われる。k近傍アルゴリズムなどの最も近い近隣分類子は、画像フィーチャと格納されているグリフフィーチャを比較し、最も近い一致を選択する。 CuneiformやTesseractなどのソフトウェアは、文字認識に2パス法を使用する。2番目のパスは「適応認識」と呼ばれ、最初のパスで高い信頼を得て認識された文字形状を使用して、2番目のパスの残りの文字をより良く認識する。これは、特殊なフォントやフォントが歪んでいる（例えば、ぼやけた、またはフェードされている）低品質でスキャンされた画像に有利である。 OCRopus や Tesseract のような最近の OCR ソフトウェアは、単一の文字に焦点を当てるのではなく、テキストの行全体を認識するように訓練されたニューラルネットワークを使用する。反復 OCR と呼ばれる新しい手法では、ページレイアウトに基づいて文書を自動的にセクションに切り取る。OCR は、ページレベルの OCR 精度を最大化するために、可変文字信頼レベルのしきい値を使用してセクションに対して個別に実行される。 OCR の結果は、標準化されたALTO 形式、米国議会図書館によって管理される専用の XML スキーマで格納される。その他の一般的な形式は、hOCR と PAGE XML である。

※この「テキスト認識」の解説は、「光学文字認識」の解説の一部です。
「テキスト認識」を含む「光学文字認識」の記事については、「光学文字認識」の概要を参照ください。

ウィキペディア小見出し辞書の「テキスト認識」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。お問い合わせ。

レフチェンコ事件

タビネズミ

ファンネルを飛ばす

>> 「テキスト認識」を含む用語の索引
テキスト認識のページへのリンク

辞書ショートカット

1 ウィキペディア小見出し辞書

カテゴリ一覧

＋ビジネス

＋業界用語

＋コンピュータ

＋自動車・バイク

＋船

＋建築・不動産

＋ヘルスケア

＋スポーツ

＋辞書・百科事典

すべての辞書の索引

Weblioのサービス

「テキスト認識」の関連用語

1

ウィキペディア小見出し辞書

16% |||||

2

百科事典

12% |||||

3

百科事典

10% |||||

4

日本語表現辞典

8% |||||

5

百科事典

8% |||||

6

Tesseract (ソフトウェア)

百科事典

4% |||||

7

百科事典

4% |||||

8

光学文字認識

百科事典

2% |||||

9

新機能・変更点

ウィキペディア小見出し辞書

2% |||||

10

iOS (アップル)

百科事典

0% |||||

テキスト認識のお隣キーワード

テキスト編集関連

テキスト行終端記号

テキスト表現

テキスト表示

テキスト表記

テキスト解析

テキスト認識

テキスト譲渡ポータル

テキスト選択

テキスト音声合成

テキトー調査隊

テキパキクッキー

テキルダーのいま

検索ランキング

テキスト認識のページの著作権
Weblio 辞書情報提供元は参加元一覧にて確認できます。


	Text is available under GNU Free Documentation License (GFDL). Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの光学文字認識 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

ビジネス｜業界用語｜コンピュータ｜電車｜自動車・バイク｜船｜工学｜建築・不動産｜学問
 文化｜生活｜ヘルスケア｜趣味｜スポーツ｜生物｜食品｜人名｜方言｜辞書・百科事典

ご利用にあたって

・Weblio辞書とは

・検索の仕方

・利用規約

・プライバシーポリシー

・サイトマップ

便利な機能

・ウェブリオのアプリ

・画像から探す

お問合せ・ご要望

・お問い合わせ

会社概要

・公式企業ページ

・会社情報

・採用情報

ウェブリオのサービス

・Weblio 辞書

・類語・対義語辞典

・英和辞典・和英辞典

・Weblio翻訳

・日中中日辞典

・日韓韓日辞典

・フランス語辞典

・インドネシア語辞典

・タイ語辞典

・ベトナム語辞典

・古語辞典

©2025 GRAS Group, Inc.RSS