Optical character recognitionとは? わかりやすく解説

Weblio 辞書 > コンピュータ > バーコード用語 > Optical character recognitionの意味・解説 

OCR

フルスペル:Optical Character Recognition
読み方オーシーアール
別名:光学文字認識

OCRとは、スキャナなどで入力され画像情報の中から、文字形状基づいて文字識別しコンピュータ上で扱える文字データへと変換する仕組みのことである。

OCRの機能備えた装置ソフトウェアも、同じくOCRと呼ばれる。この場合のOCRはOptical Character Readerの略とされる

書籍新聞などの印刷物スキャナ読み取ると、一面画像として入力される。OCRでは、主にパターン認識技術用いて画像中から文字情報認識している。一般的にはスキャナから入力され画像PC上で専用ソフトウェア利用して解析する方法取られている。また、携帯電話中にもOCRの機能搭載され機種がある。

OCRを用いることで、例えば、古い書籍情報電子データ化する場合などに、タイピングによって人手入力するよりも効率的に作業進めることができる。

OCRは、あらかじめ登録され文字パターン参照して近似の形を判定するため、複雑な字形漢字や、創作的手書き文字を完全に正しく読み取ることは難しい。補助処理として、周囲罫線などから文字位置つながり確認する処理を行っている場合も多い。


光学文字認識

(Optical character recognition から転送)

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/04/02 09:57 UTC 版)

光学文字認識(こうがくもじにんしき、: Optical character recognition)は、活字、手書きテキストの画像文字コードの列に変換するソフトウェアである。画像はイメージスキャナー写真で取り込まれた文書、風景写真(風景内の看板の文字など)、画像内の字幕(テレビ放送画像内など)が使われる[1]。一般にOCRと略記される。


注釈

  1. ^ カーツワイルは書体を選ばないOCR技術の発明者とされることもあるが、1960年代末ごろから同様の技術を開発する企業がいくつか出現している。詳しくは Schantz, The History of OCR; Data processing magazine, Volume 12 (1970), p. 46 を参照

出典

  1. ^ OnDemand, HPE Haven. “OCR Document”. 2016年4月15日時点のオリジナルよりアーカイブ。2016年4月15日閲覧。
  2. ^ a b Herbert Schantz, The History of OCR. Manchester Center, VT: Recognition Technologies Users Association, 1982.
  3. ^ "Reading Machine Speaks Out Loud" , February 1949, Popular Science.
  4. ^ Washington Daily News, April 27, 1951; New York Times, December 26, 1953
  5. ^ “音声ソフトの ScanSoft、競合する Nuance を買収”. japan.internet.com. (2005年5月10日). http://japan.internet.com/finanews/20050510/11.html 
  6. ^ Qing-An Zeng (28 October 2015). Wireless Communications, Networking and Applications: Proceedings of WCNA 2014. Springer. ISBN 978-81-322-2580-5. https://books.google.com/books?id=vCnUCgAAQBAJ 
  7. ^ Using OCR and Entity Extraction for LinkedIn Company Lookup” (2014年7月22日). 2016年4月17日時点のオリジナルよりアーカイブ。2017年6月16日閲覧。
  8. ^ How To Crack Captchas”. andrewt.net (2006年6月28日). 2013年6月16日閲覧。
  9. ^ Breaking a Visual CAPTCHA”. Cs.sfu.ca (2002年12月10日). 2013年6月16日閲覧。
  10. ^ John Resig (2009年1月23日). “John Resig – OCR and Neural Nets in JavaScript”. Ejohn.org. 2013年6月16日閲覧。
  11. ^ Tappert, C. C.; Suen, C. Y.; Wakahara, T. (1990). “The state of the art in online handwriting recognition”. IEEE Transactions on Pattern Analysis and Machine Intelligence 12 (8): 787. doi:10.1109/34.57669. https://semanticscholar.org/paper/a5b3ce16666f0d9a7ac1636370a58838a7843b0f. 
  12. ^ a b Optical Character Recognition (OCR) – How it works”. Nicomsoft.com. 2013年6月16日閲覧。
  13. ^ Sezgin, Mehmet; Sankur, Bulent (2004). “Survey over image thresholding techniques and quantitative performance evaluation”. Journal of Electronic Imaging 13 (1): 146. Bibcode2004JEI....13..146S. doi:10.1117/1.1631315. オリジナルのOctober 16, 2015時点におけるアーカイブ。. https://web.archive.org/web/20151016080410/http://webdocs.cs.ualberta.ca/~nray1/CMPUT605/track3_papers/Threshold_survey.pdf 2015年5月2日閲覧。. 
  14. ^ Gupta, Maya R.; Jacobson, Nathaniel P.; Garcia, Eric K. (2007). “OCR binarisation and image pre-processing for searching historical documents.”. Pattern Recognition 40 (2): 389. doi:10.1016/j.patcog.2006.04.043. オリジナルのOctober 16, 2015時点におけるアーカイブ。. https://web.archive.org/web/20151016080410/http://www.rfai.li.univ-tours.fr/fr/ressources/_dh/DOC/DocOCR/OCRbinarisation.pdf 2015年5月2日閲覧。. 
  15. ^ Trier, Oeivind Due; Jain, Anil K. (1995). “Goal-directed evaluation of binarisation methods.”. IEEE Transactions on Pattern Analysis and Machine Intelligence 17 (12): 1191–1201. doi:10.1109/34.476511. http://heim.ifi.uio.no/inf386/trier2.pdf 2015年5月2日閲覧。. 
  16. ^ Milyaev, Sergey; Barinova, Olga; Novikova, Tatiana; Kohli, Pushmeet; Lempitsky, Victor (2013). “Image binarisation for end-to-end text understanding in natural images.”. Document Analysis and Recognition (ICDAR) 2013 12th International Conference on: 128–132. doi:10.1109/ICDAR.2013.33. ISBN 978-0-7695-4999-6. https://www.microsoft.com/en-us/research/wp-content/uploads/2016/11/mbnlk_icdar2013.pdf 2015年5月2日閲覧。. 
  17. ^ Pati, P.B.; Ramakrishnan, A.G. (1987-05-29). “Word Level Multi-script Identification”. Pattern Recognition Letters 29 (9): 1218–1229. doi:10.1016/j.patrec.2008.01.027. 
  18. ^ Basic OCR in OpenCV | Damiles”. Blog.damiles.com (2008年11月20日). 2013年6月16日閲覧。
  19. ^ a b c Ray Smith (2007年). “An Overview of the Tesseract OCR Engine”. 2010年9月28日時点のオリジナルよりアーカイブ。2013年5月23日閲覧。
  20. ^ OCR Introduction”. Dataid.com. 2013年6月16日閲覧。
  21. ^ How OCR Software Works”. OCRWizard. 2009年8月16日時点のオリジナルよりアーカイブ。2013年6月16日閲覧。
  22. ^ The basic pattern recognition and classification with openCV | Damiles”. Blog.damiles.com (2008年11月14日). 2013年6月16日閲覧。
  23. ^ http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&p=1&u=%2Fnetahtml%2FPTO%2Fsearch-bool.html&r=1&f=G&l=50&co1=AND&d=PTXT&s1=10,679,089&OS=10,679,089&RS=10,679,089
  24. ^ a b c How does OCR document scanning work?”. Explain that Stuff (2012年1月30日). 2013年6月16日閲覧。
  25. ^ How to optimize results from the OCR API when extracting text from an image? - Haven OnDemand Developer Community”. 2016年3月22日時点のオリジナルよりアーカイブ。2020年12月21日閲覧。
  26. ^ Fehr, Tiff, How We Sped Through 900 Pages of Cohen Documents in Under 10 Minutes, Times Insider, The New York Times, March 26, 2019
  27. ^ Train Your Tesseract”. Train Your Tesseract (2018年9月20日). 2018年9月20日閲覧。
  28. ^ What is the point of an online interactive OCR text editor? - Fenno-Ugrica” (2014年2月21日). 2020年12月21日閲覧。
  29. ^ Riedl, C.; Zanibbi, R.; Hearst, M. A.; Zhu, S.; Menietti, M.; Crusan, J.; Metelsky, I.; Lakhani, K. (20 February 2016). “Detecting Figures and Part Labels in Patents: Competition-Based Development of Image Processing Algorithms”. International Journal on Document Analysis and Recognition 19 (2): 155. arXiv:1410.6751. doi:10.1007/s10032-016-0260-8. 
  30. ^ The Fifth Annual Test of OCR Accuracy”. 2012年4月27日閲覧。
  31. ^ Holley, Rose (2009年4月). “How Good Can It Get? Analysing and Improving OCR Accuracy in Large Scale Historic Newspaper Digitisation Programs”. D-Lib Magazine. 2011年1月5日閲覧。
  32. ^ Suen, C.Y., et al (1987-05-29). Future Challenges in Handwriting and Computer Applications. 3rd International Symposium on Handwriting and Computer Applications, Montreal, May 29, 1987. http://users.erols.com/rwservices/pens/biblio88.html#Suen88 2008年10月3日閲覧。. 
  33. ^ Tappert, Charles C., et al (1990-08). The State of the Art in On-line Handwriting Recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol 12 No 8, August 1990, pp 787-ff. http://users.erols.com/rwservices/pens/biblio90.html#Tappert90c 2008年10月3日閲覧。. 


「光学文字認識」の続きの解説一覧


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「Optical character recognition」の関連用語

Optical character recognitionのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



Optical character recognitionのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
日本バーコード日本バーコード
Copyright 1997-2024 (c) Nippon Barcode Co.,Ltd.. All rights are reserved.
IT用語辞典バイナリIT用語辞典バイナリ
Copyright © 2005-2024 Weblio 辞書 IT用語辞典バイナリさくいん。 この記事は、IT用語辞典バイナリOCRの記事を利用しております。
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの光学文字認識 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2024 GRAS Group, Inc.RSS