OCR
「OCR」とは・「OCR」の意味
「OCR」とは、文字をコンピュータが認識できるようデジタルデータに変換する技術であり、医療業界や銀行といった金融業界など幅広い分野で活用されている。正式な名称は「Optical Character Reader」である。人間の場合、紙媒体や画像ファイルに書かれている文章が多少読む事に苦労するような文章でも内容を理解する事は可能である。しかし、そのような文章をコンピュータが認識する事は難しい。そのため、OCRを利用して文字を解析・分析し、デジタルデータに変換する事ではじめてコンピュータはその文字を認識できるようになるのだ。もしOCRを利用せずにスキャナなどで読み込んだ紙媒体をpdfファイルとして保存すると、それはただ単に画像が添付されているだけのpdfファイルであり、記載されている文字の検索は不可能となる。つまり、OCRはスキャナなどで読み込んだ文章をコンピュータが解析して保存するには、必須な技術であると言えるだろう。そんなOCRの大きなメリットであるのが、データ入力を自動化する事ができるという点だ。OCRを活用する事で、伝票の処理などそれまで手作業で行っていた業務を自動化に移行する事ができる。伝票処理などの業務を手作業で行う場合、見落としや誤入力といったヒューマンエラーを経験した人もいるのではないだろうか。OCRを利用すればそのようなヒューマンエラーのリスクを大幅に軽減させながら、スムーズに文字のデジタルデータへの変換ができるのだ。
OCRは100%正確に文字を認識してくれるという保証はないため、人による読み込んだ文字のチェックは必要になる。しかし、手動によるデータ入力に費やしていた手間や時間が削減できるのは大きな利点であると言えるだろう。またオフィス内におけるスペースの削減に繋がり、遠隔地でも情報の共有が可能になる点もOCRのメリットの一つだ。一般的に紙媒体は、保管スペースを設ける必要があるため、オフィス内のスペースを圧迫する可能性がある。場合によっては、資料があまりにも多すぎると、保管している資料室などに資料を探しに行くという手間がかかってしまうケースもある。しかしOCRを利用すれば紙媒体の書類や資料を大きく削減する事ができ、保管場所といった物理的スペースを設ける必要がなくなるのだ。
さらにデジタル化したデータをサーバーに格納・保存しておく事で、出張などで遠隔地にいても必要な書類や資料を探して内容を確認するという事も可能だ。自宅からでも会社内のファイルをいつでも閲覧できるので、テレワークの推進にも繋がると言われている。OCRの処理の基本的な流れとしては、はじめに紙媒体に書かれている文字をスキャンして画像データに置き換え、読み込んだデータに対して色調の補正やノイズ除去などの加工を行う。尚、認識精度を向上させたいのであれば、高い解像度でスキャンを実施するのが良いだろう。ただし、スキャンする速度は遅くなるため、読み込む文字数や目的に合わせて柔軟に調整する事が必要である。次に行う作業はレイアウトの解析である。
文書によっては文字の他に図や表なども混じっているケースもあるため、レイアウト解析する事で、文字の部分と画像の部分に分ける。2つに分ける事で文字部分については次の作業である文字処理の実施、画像部分については圧縮などの加工ができるようになる。尚、事前に手作業によって領域部分などのレイアウトを登録しておくケースもある。次に実施するのは文字の処理であり、はじめに文章を1行単位に分けた後、1文字づつ切り出していく。その後、切り出した文字に対してサイズの変換を行い、特徴を抽出する。あらかじめ様々なフォントから作ったパターンと抽出した特徴をマッチさせ、文字を確定させる。最後に確定した文字をテキストデータとして処理を実施して出力する。
「OCR」の熟語・言い回し
OCRフリーとは
OCRフリーとは、OCRが持っている様々な機能を誰もが無料で自由に利用できる状態の事を指す。現在では様々なOCRのフリーソフトが登場しており、業務の効率化などを目的に幅広く活用されている。
OCRアプリとは
OCRアプリとは、撮影した画像内にある文字を認識して、文章化して読込・保存してくれるアプリの事である。パソコンやスマートフォンを使って紙媒体に記載されている文章を保存する場合、紙媒体を見ながら文字の書き起こしをしていく事は時間と手間がかかり、容易ではない。しかし、OCRアプリを利用すれば、書き起こししたい所を撮影するだけで文章を自動で読み込み、エクセルやワードといったファイル形式でも加工できる状態にしてくれる。以前は文字化けしてしまうケースも少なくなかったが、現在ではそのような問題点も改善されてきており、精度が高まってきていると言える。メンバーと共有する事ができるチャット機能があるものやホワイトボードに書いてある文字が読み取れるものなど便利な機能が備わっているOCRアプリが次々と登場している。
ai-OCRとは
ai-OCRとは、簡単に言うとOCRとAIの技術が組み合わさっている状態の事である。海外では「Intelligent Character Recognition」を略してICRと呼ばれる事もある。2つの技術を掛け合わせる事で、手書きや非定型フォーマットの文章の認識や読み取り精度の向上を実現しているのだ。例えばファックスなど紙媒体に書かれている手書きの文章も認識でき、手作業によってデータとリンクさせる必要がある業務の大幅な改善が期待できる。また、デジタル化したデータとして蓄積されるため、AIの機械学習やビックデータとして活用する事もでき、様々な紙媒体の文書をデジタルな情報資産として活かせるようになる。
ai-OCRには様々なメリットがあるが、その一つに挙げられるのが、文字の読み取りや識別の精度が高いという点である。AIを導入する事でディープランニングによる読み取り向上が期待できる他、文字の誤認識を機械学習する事も可能だ。さらに、デジタル化している文章よりも読み取りエラーの確立が高いと言われている手書きの文字における識別精度の向上も期待できる。一方、異なるフォーマットでも読み込みができる点もai-OCRのメリットである。フォーマットが非定型のai-OCRの場合、あらかじめ定義をしなくてもAIが自動で項目などを検出してくれるのだ。スキャンするだけという簡単な作業で文字を読み込んでくれるため、業務の効率化に繋がると言えるだろう。
他にも、ai-OCRのメリットとしては、異なる言語や業界用語の読み込みもできるという点も挙げられる。事前にトレーニングデータでAIに学習させる事で、幅広いテキストに対応できるようになる。日本語はもちろん、独自の文字を使用している言語や手書きの業界用語などの読み込みもできるようになるのだ。また、文字やテキストの意味や目的の生成・抽出もできる事もメリットである。そのため、デジタルデータに変換するためのデータ入力作業が必要なく、大幅な作業効率の向上が期待できる。そしてai-OCRにはもう一つ、メリットがあり、それはRPAなどと連携する事で、業務の効率化や自動化が実現できる事である。
RPAとは「Robotic Process Automation」の略であり、人が行っていた業務をロボットやシステムなどが代わりに行う事を指す。例えば送られてきたファクスの内容を見て、ロボットやシステムが注文か問い合わせかを自動で判断して対応する事ができるようになる。ai-OCRとRPAを組み合わせる事で、さらなる業務の効率化や自動化の普及が可能になる。ただ、ai-OCRの場合、初期費用やランニングコスト、オプション料金など導入にコストがかかるため、費用対効果などを考慮しながら導入するかどうか検討していく事が重要と言えるだろう。
オー‐シー‐アール【OCR】
読み方:おーしーあーる
《optical character reader》手書きされたり印刷されたりした文字や数字を、光学的に読み取る装置。光学式文字読み取り装置。
OCR
読み方:オーシーアール
別名:光学文字認識
OCRとは、スキャナなどで入力された画像情報の中から、文字の形状に基づいて文字を識別し、コンピュータ上で扱える文字データへと変換する仕組みのことである。
OCRの機能を備えた装置やソフトウェアも、同じくOCRと呼ばれる。この場合のOCRはOptical Character Readerの略とされる。
書籍や新聞などの印刷物をスキャナで読み取ると、一面の画像として入力される。OCRでは、主にパターン認識の技術を用いて、画像中から文字情報を認識している。一般的には、スキャナから入力された画像をPC上で専用のソフトウェアを利用して解析する方法が取られている。また、携帯電話の中にもOCRの機能が搭載された機種がある。
OCRを用いることで、例えば、古い書籍の情報を電子データ化する場合などに、タイピングによって人手で入力するよりも効率的に作業を進めることができる。
OCRは、あらかじめ登録された文字のパターンを参照して近似の形を判定するため、複雑な字形の漢字や、創作的な手書き文字を完全に正しく読み取ることは難しい。補助処理として、周囲の罫線などから文字の位置とつながりを確認する処理を行っている場合も多い。
スキャナ: | 光学解像度 光学式マーク読み取り装置 ニポウディスクスキャナー OCR シートフィードスキャナ スキャナ 3Dスキャン |
OCR
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/10/23 14:06 UTC 版)
ナビゲーションに移動 検索に移動OCR
- 光学文字認識 (Optical Character Recognition)、光学式文字読取装置 (Optical Character Reader) の略称。
- オイル循環率 (Oil Circulation Ratio) の略称。
- 過電流継電器 (Over Current Relay) の略称。
このページは曖昧さ回避のためのページです。一つの語句が複数の意味・職能を有する場合の水先案内のために、異なる用法を一覧にしてあります。お探しの用語に一番近い記事を選んで下さい。このページへリンクしているページを見つけたら、リンクを適切な項目に張り替えて下さい。 |
OCR
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/06/05 13:47 UTC 版)
「エリア (ストリートファイター)」の記事における「OCR」の解説
相手を足で押し倒した後、前進して踏みつける。『EXレイヤー』では相手を蹴り付けた後にドロップキックを叩き込むものに変更された。
※この「OCR」の解説は、「エリア (ストリートファイター)」の解説の一部です。
「OCR」を含む「エリア (ストリートファイター)」の記事については、「エリア (ストリートファイター)」の概要を参照ください。
- OCRのページへのリンク