その他の文字符号化方式
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/06 03:14 UTC 版)
前述のISO-2022-JPのように半角片仮名が使用できない文字符号化方式が存在する一方で、半角片仮名を規格に含む方式も多数存在し、コンピュータ上での文書保存やWorld Wide Webで利用可能である。 Shift_JISは、JIS X 0201の8ビット符号の未使用領域に漢字などの1バイト目を割り当てたエンコーディングであるので、エスケープシーケンスなどを用いず半角カナや漢字を使用できる。1バイトJIS X 0201との共存を前提としたため、JIS X 0208文字の1バイト目に使用できる領域が限られた結果、2バイト目に7ビットコードを使用せざるを得なくなり、8ビットを利用した符号化にも関わらず、Shift_JISを理解しない処理系での扱いを難しいものにするという欠点を残した。 日本語EUC (EUC-JP) も8ビット環境を前提とした文字コードだが、JIS X 0208の1文字目にあたるコードは、JIS X 0201を1バイトで表した場合の半角カナ部分に重なるように配置されている。そのため、半角カナに相当する文字を使用する必要がある場合は制御文字SS2(シングルシフト2、0x8E)に続けて使用することになる(このため一見2バイトに見えるが、SS2は文字集合を次の1文字分だけ切り替えるという印のため、片仮名自体はやはり1バイトで符号化される)。この記法によるカナ使用を実装していない処理系も多い。 EUC-JPにおいてJIS X 0208を表すために使用されるコード範囲 (0xA1–0xFE) は、1バイトカナのコード範囲 (0xA1–0xDF) を完全に内包するため、偶数の文字数で書かれたShift_JISの半角カナは、EUC-JP文字列と(頻度やパターンからの推測以外の方法では)区別がつかない。逆に、EUC-JPの半角カナ(1バイト目0x8E、2バイト目0xA1–0xFE)文字列も、Shift_JIS文字列と区別がつかない。これが「半角カナは文字化けする」と言われる理由の1つである。 国際規格の文字符号化方式であるUnicode(UTF-8, UTF-16など)にも半角片仮名は含まれており、Unicodeが一般的となった2020年現在においては世界中で半角片仮名が利用可能となっている。Unicodeによって文字コード間の対応が保証されたことにより、将来のシステムで半角カナが非サポートとなるような事態はまず無くなったと考えてよい。
※この「その他の文字符号化方式」の解説は、「半角カナ」の解説の一部です。
「その他の文字符号化方式」を含む「半角カナ」の記事については、「半角カナ」の概要を参照ください。
- その他の文字符号化方式のページへのリンク