スキャンした文書
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/31 05:08 UTC 版)
「Portable Document Format」の記事における「スキャンした文書」の解説
紙資料をイメージスキャナなどを使って電子文書にする場合も、PDFが利用されることが多い。 紙資料を電子文書化するとき、PDFを利用しない場合には、TIFFなどの画像ファイルとして保存する方法と、OCRソフトウェアを使ってテキストとして保存する方法がある。画像ファイルとして保存された電子文書は画面上で見る場合には紙資料と同じ内容が再現できるものの、文章や文字をコピーすることができないなどテキストの再利用に大きな制限がある。また、OCRソフトウェアを使って作成したテキストファイルではテキストの再利用は可能となるが、OCRソフトウェアの精度の問題もあり、元の内容を完全に再現できない場合が多い。 PDFを利用すれば、紙資料をスキャンした画像の上にOCRソフトウェアで変換して作成した透明テキストを重ね、1つのファイルとして保存することができる。こうしたPDFの文書では、画面上で見る場合には紙資料の内容を完全に再現でき、不完全ではあるがテキストの再利用もできる。例えば、Acrobatにはバージョン6.0以降のStandard版以上でOCR機能が標準で搭載されるようになった。
※この「スキャンした文書」の解説は、「Portable Document Format」の解説の一部です。
「スキャンした文書」を含む「Portable Document Format」の記事については、「Portable Document Format」の概要を参照ください。
- スキャンした文書のページへのリンク