文字符号化形式と文字符号化スキームとは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > 文字符号化形式と文字符号化スキームの意味・解説 

文字符号化形式と文字符号化スキーム

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/01/11 02:08 UTC 版)

文字符号化方式」の記事における「文字符号化形式と文字符号化スキーム」の解説

Unicodeでは、文字符号化スキーム (CES) を、文字符号化形式 (CEF) と、バイト直列化等の2つ段階分けて標準化している。 符号化文字集合符号化形式(CEF)符号化スキーム(CES)Unicode文字集合 UTF-8 UTF-8 UTF-16 UTF-16BE UTF-16LE UTF-16 UTF-32 UTF-32BE UTF-32LE UTF-32 Unicodeでは、Unicode符号化文字集合U+0000U+10FFFFの各符号位置に、Unicodeスカラ値という非負整数値を対応付けている。CEFは、このUnicodeスカラ値を符号単位列に変換するUnicodeCEFには、UTF-8UTF-16UTF-32があり、これらが使う符号単位それぞれ符号なし8ビット整数符号なし16ビット整数符号なし32ビット整数である。これらの文字符号化形式プログラムにおける文字の内部表現として実装される。 しかし、情報交換のためファイル読み書き通信を行う場合には、符号単位列をバイト列にする必要があり、8ビット以外の符号単位列をバイト列にするには、バイト順序エンディアン)を決め必要がある。そのためCESでは、CEF加えバイト直列化の手続き決める、つまり、エンディアン指定するかまたはエンディアン記述する方法規格化している。(各CESバイト直列化具体的な内容については、UTF-16#符号化スキーム参照Unicode定められCEFCESは、表のものがある(ただし、Unicode技術標準SCSU (UTS 6) が、Unicode技術報告UTF-EBCDIC (UTR 16) とCESU-8 (UTR 26) が、Unicode技術ノートでBOCU-1 (UTN 6) が、その他、ISO/IEC標準RFCで、Unicode文字集合使ったCEFCES規格化している)。同じ名称のCEFCESがあり、これらを区別するときは、「UTF-16符号化形式」「UTF-16符号化スキーム」のように呼ぶ。一般にUTF-16呼ばれるものは、UTF-16符号化形式対応する3つのCES総称である。なお、UTF-8符号化形式UTF-8符号化スキーム実質的に同じものだが、便宜上分けている。 Unicode以外でも、原理的にCEFCES区別して論ずることができる。しかし、ほとんどの場合8ビット整数符号単位とするため、UTF-8場合同様に区別する意味は少ない。たとえば、Shift_JIS文字データを扱うプログラムは、8ビット整数符号単位とするマルチバイト文字文字データの処理行っているため、ファイル読み書き通信などでバイト直列化処理をあらためて行うことはない。

※この「文字符号化形式と文字符号化スキーム」の解説は、「文字符号化方式」の解説の一部です。
「文字符号化形式と文字符号化スキーム」を含む「文字符号化方式」の記事については、「文字符号化方式」の概要を参照ください。

ウィキペディア小見出し辞書の「文字符号化形式と文字符号化スキーム」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「文字符号化形式と文字符号化スキーム」の関連用語

文字符号化形式と文字符号化スキームのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



文字符号化形式と文字符号化スキームのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの文字符号化方式 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS