文字符号化形式と文字符号化スキームとは何？わかりやすく解説 Weblio辞書

索引トップ用語の索引ランキング

文字符号化形式と文字符号化スキーム

出典: フリー百科事典『ウィキペディア（Wikipedia）』 (2021/01/11 02:08 UTC 版)

「文字符号化方式」の記事における「文字符号化形式と文字符号化スキーム」の解説

Unicodeでは、文字符号化スキーム (CES) を、文字符号化形式 (CEF) と、バイト直列化等の2つの段階に分けて標準化している。符号化文字集合符号化形式(CEF)符号化スキーム(CES)Unicode 文字集合 UTF-8 UTF-8 UTF-16 UTF-16BE UTF-16LE UTF-16 UTF-32 UTF-32BE UTF-32LE UTF-32 Unicodeでは、Unicode 符号化文字集合のU+0000〜U+10FFFFの各符号位置に、Unicode スカラ値という非負整数値を対応付けている。CEFは、このUnicode スカラ値を符号単位列に変換する。UnicodeのCEFには、UTF-8・UTF-16・UTF-32があり、これらが使う符号単位はそれぞれ、符号なし8ビット整数・符号なし16ビット整数・符号なし32ビット整数である。これらの文字符号化形式はプログラムにおける文字の内部表現として実装される。しかし、情報交換のためファイルの読み書きや通信を行う場合には、符号単位列をバイト列にする必要があり、8ビット以外の符号単位列をバイト列にするには、バイト順序（エンディアン）を決める必要がある。そのためCESでは、CEFに加え、バイト直列化の手続きを決める、つまり、エンディアンを指定するかまたはエンディアンを記述する方法を規格化している。（各CESのバイト直列化の具体的な内容については、UTF-16#符号化スキームを参照） Unicodeで定められたCEFとCESは、表のものがある（ただし、Unicode 技術標準でSCSU (UTS 6) が、Unicode 技術報告でUTF-EBCDIC (UTR 16) とCESU-8 (UTR 26) が、Unicode 技術ノートでBOCU-1 (UTN 6) が、その他、ISO/IEC 標準やRFCで、Unicode 文字集合を使った CEFやCESを規格化している）。同じ名称のCEFとCESがあり、これらを区別するときは、「UTF-16 符号化形式」「UTF-16 符号化スキーム」のように呼ぶ。一般に UTF-16と呼ばれるものは、UTF-16 符号化形式に対応する 3つの CESの総称である。なお、UTF-8 符号化形式とUTF-8 符号化スキームは実質的に同じものだが、便宜上、分けている。 Unicode以外でも、原理的にはCEFとCESを区別して論ずることができる。しかし、ほとんどの場合 8ビット整数を符号単位とするため、UTF-8の場合と同様に区別する意味は少ない。たとえば、Shift_JISの文字データを扱うプログラムは、8ビット整数を符号単位とするマルチバイト文字の文字データの処理を行っているため、ファイルの読み書きや通信などでバイト直列化処理をあらためて行うことはない。

※この「文字符号化形式と文字符号化スキーム」の解説は、「文字符号化方式」の解説の一部です。
「文字符号化形式と文字符号化スキーム」を含む「文字符号化方式」の記事については、「文字符号化方式」の概要を参照ください。

ウィキペディア小見出し辞書の「文字符号化形式と文字符号化スキーム」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。お問い合わせ。

>> 「文字符号化形式と文字符号化スキーム」を含む用語の索引
文字符号化形式と文字符号化スキームのページへのリンク

文字符号化形式と文字符号化スキームとは？わかりやすく解説

文字符号化形式と文字符号化スキーム

「文字符号化形式と文字符号化スキーム」の関連用語


	Text is available under GNU Free Documentation License (GFDL). Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの文字符号化方式 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

文字符号化形式と文字符号化スキームとは？ わかりやすく解説

文字符号化形式と文字符号化スキーム

急上昇のことば

「文字符号化形式と文字符号化スキーム」の関連用語

文字符号化形式と文字符号化スキームとは？わかりやすく解説