光学文字認識
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/04/02 09:57 UTC 版)
認識精度
![]() |
1990年代中ごろ、アメリカ合衆国エネルギー省 (DOE) は情報科学研究所 (ISRI) に印刷文書の認識技術育成という使命を与えた。それにより5年間に渡って Annual Test of OCR Accuracy がまとめられた[30]。
ラテン文字の活字文書の正確な認識はほとんど解決済みの問題だが、識字率(文字を正しく認識する確率)は100%ではなく、間違いの許されない状況では人間が結果を確認する必要がある。19世紀および20世紀初頭の新聞を使った研究によると、単純に文字単位で認識する市販のOCRソフトウェアの識字率は71%から98%だった[31]。手書き文字、特に筆記体の手書き文字認識や文字数の多い言語の文字認識ではまだ研究の余地がある。
文字認識の精度はいくつかの測定法で表され、実際に使用した測定法によって精度は大きく左右される。例えば、文脈や辞書を使わずに純粋に文字単位で認識する場合、識字率が99%であっても、単語ベースの誤り率は5%となるかもしれない[32]。
光学文字認識と混同される機能にオンライン文字認識がある[33](手書き文字認識参照)。OCRは基本的にオフラインの文字認識であり、純粋に文字の静的な形状を認識する。一方オンライン文字認識は、文字が書かれる動的な過程を認識する。例えば、PenPoint OS やタブレットコンピュータなどがジェスチャーを認識するのもオンライン認識の一種であり、ペンがどういう方向にどれだけ動いたかを認識する。
手書き文字認識システムは近年、商用で成功している分野である。この技術はPalm OSなどが動作する携帯情報端末で入力手段として採用された。Apple Newtonがこの技術の先駆者である。これらの機器では筆順や速度や線の方向が入力時に分かるので比較的認識が容易である。また、ユーザー側も徐々に認識されやすい文字を書くようにトレーニングされるという面もある。一方、紙に書かれた手書き文字を認識するソフトウェアには上記の利点が無いため、識字率はいまだ十分とは言えない。きれいに書かれた手書き文字でも識字率は80%から90%であり、1ページにつき数十個の認識不能文字が出現することになる。これは非常に限られた分野でしか実用化できないレベルである。
筆記体文書の認識は研究が盛んであるが、識字率はさらに低い。筆記体の文字認識の識字率を高めるには、文脈や文法の情報を使わなければならない。例えば、辞書の単語を認識するのは、手書き原稿の個々の文字を認識するよりも簡単である。小切手に書かれた数字の列は小さな辞書を使えばよいので識字率を上げることができる。スキャンしている文書の言語の文法に関する知識があれば、単語が名詞なのか動詞なのかを判別することが可能となり識字率を上げることができる。手書き文字の形だけでは正確な認識(一般に98%以上)は不可能といってよい。
注釈
- ^ カーツワイルは書体を選ばないOCR技術の発明者とされることもあるが、1960年代末ごろから同様の技術を開発する企業がいくつか出現している。詳しくは Schantz, The History of OCR; Data processing magazine, Volume 12 (1970), p. 46 を参照
出典
- ^ OnDemand, HPE Haven. “OCR Document”. 2016年4月15日時点のオリジナルよりアーカイブ。2016年4月15日閲覧。
- ^ a b Herbert Schantz, The History of OCR. Manchester Center, VT: Recognition Technologies Users Association, 1982.
- ^ "Reading Machine Speaks Out Loud" , February 1949, Popular Science.
- ^ Washington Daily News, April 27, 1951; New York Times, December 26, 1953
- ^ “音声ソフトの ScanSoft、競合する Nuance を買収”. japan.internet.com. (2005年5月10日)
- ^ Qing-An Zeng (28 October 2015). Wireless Communications, Networking and Applications: Proceedings of WCNA 2014. Springer. ISBN 978-81-322-2580-5
- ^ “Using OCR and Entity Extraction for LinkedIn Company Lookup” (2014年7月22日). 2016年4月17日時点のオリジナルよりアーカイブ。2017年6月16日閲覧。
- ^ “How To Crack Captchas”. andrewt.net (2006年6月28日). 2013年6月16日閲覧。
- ^ “Breaking a Visual CAPTCHA”. Cs.sfu.ca (2002年12月10日). 2013年6月16日閲覧。
- ^ John Resig (2009年1月23日). “John Resig – OCR and Neural Nets in JavaScript”. Ejohn.org. 2013年6月16日閲覧。
- ^ Tappert, C. C.; Suen, C. Y.; Wakahara, T. (1990). “The state of the art in online handwriting recognition”. IEEE Transactions on Pattern Analysis and Machine Intelligence 12 (8): 787. doi:10.1109/34.57669 .
- ^ a b “Optical Character Recognition (OCR) – How it works”. Nicomsoft.com. 2013年6月16日閲覧。
- ^ Sezgin, Mehmet; Sankur, Bulent (2004). “Survey over image thresholding techniques and quantitative performance evaluation”. Journal of Electronic Imaging 13 (1): 146. Bibcode: 2004JEI....13..146S. doi:10.1117/1.1631315. オリジナルのOctober 16, 2015時点におけるアーカイブ。 2015年5月2日閲覧。.
- ^ Gupta, Maya R.; Jacobson, Nathaniel P.; Garcia, Eric K. (2007). “OCR binarisation and image pre-processing for searching historical documents.”. Pattern Recognition 40 (2): 389. doi:10.1016/j.patcog.2006.04.043. オリジナルのOctober 16, 2015時点におけるアーカイブ。 2015年5月2日閲覧。.
- ^ Trier, Oeivind Due; Jain, Anil K. (1995). “Goal-directed evaluation of binarisation methods.”. IEEE Transactions on Pattern Analysis and Machine Intelligence 17 (12): 1191–1201. doi:10.1109/34.476511 2015年5月2日閲覧。.
- ^ Milyaev, Sergey; Barinova, Olga; Novikova, Tatiana; Kohli, Pushmeet; Lempitsky, Victor (2013). “Image binarisation for end-to-end text understanding in natural images.”. Document Analysis and Recognition (ICDAR) 2013 12th International Conference on: 128–132. doi:10.1109/ICDAR.2013.33. ISBN 978-0-7695-4999-6 2015年5月2日閲覧。.
- ^ Pati, P.B.; Ramakrishnan, A.G. (1987-05-29). “Word Level Multi-script Identification”. Pattern Recognition Letters 29 (9): 1218–1229. doi:10.1016/j.patrec.2008.01.027.
- ^ “Basic OCR in OpenCV | Damiles”. Blog.damiles.com (2008年11月20日). 2013年6月16日閲覧。
- ^ a b c Ray Smith (2007年). “An Overview of the Tesseract OCR Engine”. 2010年9月28日時点のオリジナルよりアーカイブ。2013年5月23日閲覧。
- ^ “OCR Introduction”. Dataid.com. 2013年6月16日閲覧。
- ^ “How OCR Software Works”. OCRWizard. 2009年8月16日時点のオリジナルよりアーカイブ。2013年6月16日閲覧。
- ^ “The basic pattern recognition and classification with openCV | Damiles”. Blog.damiles.com (2008年11月14日). 2013年6月16日閲覧。
- ^ http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&p=1&u=%2Fnetahtml%2FPTO%2Fsearch-bool.html&r=1&f=G&l=50&co1=AND&d=PTXT&s1=10,679,089&OS=10,679,089&RS=10,679,089
- ^ a b c “How does OCR document scanning work?”. Explain that Stuff (2012年1月30日). 2013年6月16日閲覧。
- ^ “How to optimize results from the OCR API when extracting text from an image? - Haven OnDemand Developer Community”. 2016年3月22日時点のオリジナルよりアーカイブ。2020年12月21日閲覧。
- ^ Fehr, Tiff, How We Sped Through 900 Pages of Cohen Documents in Under 10 Minutes, Times Insider, The New York Times, March 26, 2019
- ^ “Train Your Tesseract”. Train Your Tesseract (2018年9月20日). 2018年9月20日閲覧。
- ^ “What is the point of an online interactive OCR text editor? - Fenno-Ugrica” (2014年2月21日). 2020年12月21日閲覧。
- ^ Riedl, C.; Zanibbi, R.; Hearst, M. A.; Zhu, S.; Menietti, M.; Crusan, J.; Metelsky, I.; Lakhani, K. (20 February 2016). “Detecting Figures and Part Labels in Patents: Competition-Based Development of Image Processing Algorithms”. International Journal on Document Analysis and Recognition 19 (2): 155. arXiv:1410.6751. doi:10.1007/s10032-016-0260-8.
- ^ “The Fifth Annual Test of OCR Accuracy”. 2012年4月27日閲覧。
- ^ Holley, Rose (2009年4月). “How Good Can It Get? Analysing and Improving OCR Accuracy in Large Scale Historic Newspaper Digitisation Programs”. D-Lib Magazine. 2011年1月5日閲覧。
- ^ Suen, C.Y., et al (1987-05-29). Future Challenges in Handwriting and Computer Applications. 3rd International Symposium on Handwriting and Computer Applications, Montreal, May 29, 1987 2008年10月3日閲覧。.
- ^ Tappert, Charles C., et al (1990-08). The State of the Art in On-line Handwriting Recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol 12 No 8, August 1990, pp 787-ff 2008年10月3日閲覧。.
光学文字認識と同じ種類の言葉
- 光学文字認識のページへのリンク