日本語のエンコード
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/31 05:08 UTC 版)
「Portable Document Format」の記事における「日本語のエンコード」の解説
文字コードについては、全ての文字列が独自のルールで英数字にエンコードされる。英語文書の場合はある程度解読できるが、多バイト文字になると非常に複雑なルールでエンコードしなければならない。 それで得られるメリットは、処理系にかかわらず文字を正確に区別できることで、例えばJIS90形式の文字とJIS2004形式の文字はJIS、Unicode上では同じ文字コードでありながら字形が異なる文字があり、普通の処理系ではどちらかのフォントしか表示できないが、PDF上では一緒に記述できることが挙げられる。 しかしながら例えばWindows 2000とWindows Vista間ではMS明朝、MSゴシックのフォントのバージョンは異なり、フォントを埋め込まないようにPDFを作成すると、片方の環境では文字が全面的に文字化けするケースがある。 また、フォントが埋め込まれているため文字化けしていないように見えても、文面をクリップボードにコピーしてエディタに貼り付けると、テキストストリームが異機種のエンコーディングになっていて文字化けするケースもある。 Adobe製品は比較的問題が起こりにくいが、サードパーティー製品や海外製のソフトウェアでは現在[いつ?]もこの種の問題に遭遇することがある。
※この「日本語のエンコード」の解説は、「Portable Document Format」の解説の一部です。
「日本語のエンコード」を含む「Portable Document Format」の記事については、「Portable Document Format」の概要を参照ください。
- 日本語のエンコードのページへのリンク