Compound Text Encoding (CTEXT)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/03/30 06:03 UTC 版)
「ISO/IEC 2022」の記事における「Compound Text Encoding (CTEXT)」の解説
表5 Compound Text Encoding で拡張された制御機能制御機能説明01/11 02/05 02/15 03/00 M L 可変長の符号化システムの指示 01/11 02/05 02/15 03/01 M L 1文字1バイトの符号化システムの指示 01/11 02/05 02/15 03/02 M L 1文字2バイトの符号化システムの指示 01/11 02/05 02/15 03/03 M L 1文字3バイトの符号化システムの指示 01/11 02/05 02/15 03/04 M L 1文字4バイトの符号化システムの指示 01/11 02/05 04/07 UTF-8に切り替える 01/11 02/05 04/00 UTF-8から戻る 09/11 03/01 05/13 書字方向を左から右とする 09/11 03/02 05/13 書字方向を右から左とする 09/11 05/13 直近に行った書字方向の指定から戻る a M L で指示の後につづく要素のバイト数を示す。M と L の最上位桁ビット (常に1) を除く合計14ビットが表す値がバイト数となる。要素内は、符号化システムの名前ではじまり、00/02 (STX) で区切ってその後に実際の符号化文字要素が続く。 b XFree86による拡張。本来の Compound Text Encoding では ISO に登録された「他の符号化システム」は使わないことになっている。 c ISO/IEC 6429の機能。 Compound Text Encoding (CTEXT) は、ISO/IEC 2022およびISO/IEC 6429の機構に準じつつそれを拡張した8ビット符号の符号化方式である。X Window Systemにおいて、クライアント間のテキスト情報の伝達や、リソース中のテキスト情報の表現に用いる。次のような特徴を持つ。 アナウンス機能のエスケープシーケンスは省略する。 8ビット符号なので、GR領域も使う。 G0にASCIIを、G1にISO/IEC 8859-1の右半分を指示し、G0をGL領域に、G1をGR領域に呼び出した状態で始まる (このための制御機能は省略する)。つまり、最初はISO/IEC 8859-1で始まる。 G0およびG1への指示がGL領域およびGR領域への呼び出しを兼ねる。呼び出しの制御機能は使わない。つまり、文字集合の選択は指示のエスケープシーケンスだけで行う。 ISO/IEC 2022のDOCS (#表2参照) と私用終端バイトにより、利用者独自の文字集合や、UTF-8 のようにISO/IEC 2022に準拠した構造の符号表を持たない符号化システムを指示する (#表5参照)。 ISO/IEC 6429のSDSにより書字方向を指定する (#表5参照)。 また、つぎの点で ISO/IEC 2022 に対する拡張となっている。 指示のエスケープシーケンスでは、中間バイト02/08の省略 (#表2 注参照) をしない。 この結果、複数の符号化システムや文字集合が混在する場合でも、文字コード変換による情報の劣化を起こさず、またクライアントが対応していない符号化システムや文字集合の情報も伝達することが可能になっている。なお、これは異なるアプリケーションの間でのテキスト情報の交換のための符号化方式を定めたものであり、個々のアプリケーション内部でのテキスト処理の際は、適当な内部形式に変換してから処理することが想定されている。
※この「Compound Text Encoding (CTEXT)」の解説は、「ISO/IEC 2022」の解説の一部です。
「Compound Text Encoding (CTEXT)」を含む「ISO/IEC 2022」の記事については、「ISO/IEC 2022」の概要を参照ください。
- Compound Text Encodingのページへのリンク