文字集合の混乱
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/02/27 13:58 UTC 版)
これらのASCII拡張は非常に多くの変種を持つため、ある特定のテキストでどの集合が使われているか識別することは、テキストを正しく解釈するために必要である。しかしながら、もっともよく使われる文字 (ASCIIの7ビット符号位置にあるもの) はすべての集合で共通なので(拡張ASCII以外でもほとんどの文字集合で共通である)、文字集合の正しい識別に失敗しても英文は問題なく読める。さらに、多くのインターネット標準はISO 8859-1を使い、OSシェアトップのWindowsの使うコードページ1252もISO 8859-1の上位集合であるため、多くの場合ISO 8859-1が予告なしに使われている。このため何も情報がなかった場合欧米ではISO 8859-1が使われている可能性が高く、デフォルトでこれを仮定すると多くの場合うまくいく。 多くのプロトコル、もっとも重要なのは電子メールとHTTPにおいて、通信内容の文字コードはIANAが割り当てた文字コード識別子でタグ付けしなければならない。
※この「文字集合の混乱」の解説は、「拡張ASCII」の解説の一部です。
「文字集合の混乱」を含む「拡張ASCII」の記事については、「拡張ASCII」の概要を参照ください。
- 文字集合の混乱のページへのリンク