視覚障害者向けの活用
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/18 18:37 UTC 版)
「光学文字認識」の記事における「視覚障害者向けの活用」の解説
1974年、レイ・カーツワイルはあらゆる書体を読み取れるOCRの開発を行う Kurzweil Computer Products, Inc. を創業。カーツワイルは、音声合成技術と組合わせればこの技術が視覚障害者にとって最も役立つと考えた。鍵となる技術はCCDイメージスキャナと音声合成である。1976年1月13日、製品の完成披露が行われた。1978年、カーツワイルはOCRソフトウェアの販売を開始。最初の顧客はレクシスネクシスで、ニュースなどの文書をデータベースに入力するのに使った。2年後、カーツワイルは会社をゼロックスに売却。後にゼロックスはその部門を Scansoft としてスピンオフさせ、Scansoft はニュアンスコミュニケーションズと合併した。 2000年代には、OCRはクラウドコンピューティング環境でサービスとしてオンラインで利用可能 (WebOCR) になり、外国語の看板のリアルタイム翻訳のように、スマートフォン上のモバイルアプリケーションで利用できるようになった。スマートフォンやスマートグラスの出現により、OCRは、デバイスのカメラを使用してキャプチャされたテキストを抽出するインターネット接続モバイルデバイスアプリケーションで使用されるようになった。オペレーティング システムに OCR 機能が組み込まれていないこれらのデバイスは、通常、OCR API を使用して、デバイスによってキャプチャおよび提供されるイメージ ファイルからテキストを抽出する。OCR APIは、抽出されたテキストを、元の画像で検出されたテキストの位置に関する情報とともに、デバイスアプリに戻して、テキスト読み上げなどの処理や表示に利用する。 ラテン語、キリル文字、アラビア語、ヘブライ語、ヒンディー語、ベンガル語、デーヴァナーガリー、タミル語、中国語、韓国語(ハングル)そして日本語など、多くの言語で、さまざまな商用およびオープンソースのOCRシステムが利用可能である。
※この「視覚障害者向けの活用」の解説は、「光学文字認識」の解説の一部です。
「視覚障害者向けの活用」を含む「光学文字認識」の記事については、「光学文字認識」の概要を参照ください。
- 視覚障害者向けの活用のページへのリンク