7ビット符号によるマルチバイト用のキャラクタセット
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/03/30 06:03 UTC 版)
「ISO/IEC 2022」の記事における「7ビット符号によるマルチバイト用のキャラクタセット」の解説
ISO/IEC 2022の機構を使う7ビット符号のキャラクタセットには以下のものが含まれる。次のような特徴を持つ。 アナウンス機能のエスケープシーケンスは省略する。 7ビット符号なので、GR領域は使わず、C1制御文字はエスケープシーケンスで表す。 最初は、G0にASCIIを指示し、G0をGL領域に呼び出した状態で始まる (このための制御機能は省略する)。つまり、最初はUS-ASCIIで始まる。 行の終わりではASCIIに戻さなければならない。 #表3に、これらのキャラクタセットで用いる符号化文字集合と、その選択のための制御機能を示す。 ISO-2022-JPでの「日本語版Wikipedia」という文字列の符号化を例に説明する (#表3も参照)。 図2 ISO-2022-JPによる「日本語版Wikipedia」の符号化文字 日 本 語 版 W i k i p e d i a 機能区点行列JIS X 0208を指示 38-92 43-60 24-76 40-39 ASCIIを指示 05/07 06/09 06/11 06/09 07/00 06/05 06/04 06/09 06/01 符号01/11 02/04 04/02 04/06 07/12 04/11 05/12 03/08 06/12 04/08 04/07 01/11 02/08 04/02 05/07 06/09 06/11 06/09 07/00 06/05 06/04 06/09 06/01 ESC $ B F | K \ 8 l H G ESC ( B W i k i p e d i a 上図で、上段が符号化したい文字列である。「日本語版」は JIS X 0208 に含まれる文字の列、「Wikipedia」はASCIIに含まれる文字の列である。また、最初はASCIIで始まる。したがって、「日本語版」の直前と「Wikipedia」の直前に文字集合を指示するエスケープシーケンスが必要になる (ISO-2022-JP では指示が呼び出しを兼ねるので、呼び出しの制御機能は必要ない)。マルチバイト文字は区点で、シングルバイト文字は行列で表すと、中段のようになる。区点を2バイトずつで表し、全体を7ビット符号で表すと、下段のように符号化される。 表3 7ビット符号のマルチバイト用キャラクタセットでの文字集合の選択キャラクタセット対象言語文字集合文字集合選択のための制御機能指示呼び出し ISO-2022-JP 日本語 ASCII G0 .mw-parser-output .monospaced{font-family:monospace,monospace}01/11 02/08 04/02 ESC ( B 指示が兼ねる(ロッキングシフト) JIS C 6220-1976のラテン文字集合 (ISO/IEC 646の日本版) 01/11 02/08 04/10 ESC ( J JIS C 6226-1978 01/11 02/04 04/00 ESC $ @ JIS X 0208-1983またはJIS X 0208:1990 01/11 02/04 04/02 ESC $ B ISO-2022-JP-1 日本語 ISO-2022-JP に以下を追加 JIS X 0212-1990 G0 01/11 02/04 02/08 04/04 ESC $ ( D 指示が兼ねる(ロッキングシフト) ISO-2022-JP-2 多言語 ISO-2022-JP-1 に以下を追加 GB 2312-80 G0 01/11 02/04 04/01 ESC $ A 指示が兼ねる(ロッキングシフト) KS X 1001-1992 01/11 02/04 02/08 04/03 ESC $ ( C ISO/IEC 8859-1 の右半分 G2 01/11 02/14 04/01 ESC . A 01/11 04/14 ESC N (シングルシフト) ISO/IEC 8859-7 の右半分 01/11 02/14 04/06 ESC . F ISO-2022-JP-3 日本語 ISO-2022-JP に以下を追加 JIS X 0213:2000の1面 G0 01/11 02/04 02/08 04/15 ESC $ ( O 指示が兼ねる(ロッキングシフト) JIS X 0213:2000の2面 01/11 02/04 02/08 04/16 ESC $ ( P ISO-2022-JP-2004 日本語 ISO-2022-JP-3 に以下を追加 JIS X 0213:2004の1面 G0 01/11 02/04 02/08 04/17 ESC $ ( Q 指示が兼ねる(ロッキングシフト) ISO-2022-KR 韓国語 ASCII G0 初めから指示したまま 00/15 SI (ロッキングシフト) KS X 1001-1992 G1 01/11 02/04 02/09 04/03 ESC $ ) C ただし、行の初めに置く 00/14 SO (ロッキングシフト) ISO-2022-CN 中国語 ASCII G0 初めから指示したまま 00/15 SI (ロッキングシフト) GB 2312-80 G1 01/11 02/04 02/09 04/01 ESC $ ) A 00/14 SO (ロッキングシフト) CNS 11643-1992の1面 01/11 02/04 02/09 04/07 ESC $ ) G CNS 11643-1992の2面 G2 01/11 02/04 02/10 04/08 ESC $ * H 01/11 04/14 ESC N(シングルシフト) ISO-2022-CN-EXT 中国語 ISO-2022-CN に以下を追加 ISO-IR-165 G1 01/11 02/04 02/09 04/05 ESC $ ) E 00/14 SO (ロッキングシフト) GB 12345-90 未定 GB 7589-87 G2 未定 01/11 04/14 ESC N(シングルシフト) GB 13131-91 未定 GB 7590-87 G3 未定 01/11 04/15 ESC O (シングルシフト) GB 13132-91 未定 CNS 11643-1992の3面 01/11 02/04 02/11 04/09 ESC $ + I CNS 11643-1992の4面 01/11 02/04 02/11 04/10 ESC $ + J CNS 11643-1992の5面 01/11 02/04 02/11 04/11 ESC $ + K CNS 11643-1992の6面 01/11 02/04 02/11 04/12 ESC $ + L CNS 11643-1992の7面 01/11 02/04 02/11 04/13 ESC $ + M
※この「7ビット符号によるマルチバイト用のキャラクタセット」の解説は、「ISO/IEC 2022」の解説の一部です。
「7ビット符号によるマルチバイト用のキャラクタセット」を含む「ISO/IEC 2022」の記事については、「ISO/IEC 2022」の概要を参照ください。
- 7ビット符号によるマルチバイト用のキャラクタセットのページへのリンク