再利用が困難
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/31 05:08 UTC 版)
「Portable Document Format」の記事における「再利用が困難」の解説
PDFは、文字のレイアウトが崩れにくいため、最終成果物として公開するのには適している。しかし文字列の抽出や他形式にコンバートを試みると困難に直面する。というのはプレーンなPDFでは、ある文字列のブロック、隣接または上に重なる文字列やグラフィックとの論理的な対応関係を示す情報が乏しいためである。言い換えれば、PDF上では文字列が、変換元文書にあったコンテキストを無視した文字の羅列になってしまうのである。これはKindleをはじめとする、画面の小さいビューアー用フォーマットへの変換を困難にする。また視覚障碍者向けの拡大表示、読み上げなどアクセシビリティにとって障壁となる。 これに対応するため、PDFには「タグ」機能が追加され、PDFへの変換時に文字列がどの順番で読まれるべきか、見出しとの関係などの情報が追加されるようになったが、紙をスキャンして作成されたPDFではタグは軽視されることが多い。
※この「再利用が困難」の解説は、「Portable Document Format」の解説の一部です。
「再利用が困難」を含む「Portable Document Format」の記事については、「Portable Document Format」の概要を参照ください。
- 再利用が困難のページへのリンク