ユーティーエフ‐じゅうろく【UTF-16】〔‐ジフロク〕
UTF-16
読み方:ユーティーエフじゅうろく
UTF-16とは、Unicode、または、UCSを16ビットを単位とした可変長マルチバイトでエンコーディングする方式のことである。
2バイトで定義されているコード(U+0000~U+D7FFF、U+E000~U+FFFF)はそのままで、サロゲートペアで定義されているコードは4バイトにエンコードされる。
16ビットデータを全てのシステムで統一的に扱うためには、エンディアンの違いは避けては通れない問題である。UTF-16にもビッグエンディアン用のUTF-16BE、リトルエンディアン用のUTF-16LEがある。また、BOMによりエンディアンの指定も可能である。なお、BOMがないテキストはビッグエンディアンと解釈されることになっている。
参照リンク
RFC 2781 - UTF-16, an encoding of ISO 10646 - (英文)
文字コード: | Unicode UTF UTF-7 UTF-16 UTF-8 Unicode 10.0 Unicode 6.0 |
UTF-16
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/02/11 06:46 UTC 版)
UTF-16 (UCS/Unicode Transformation Format 16[注釈 1]) とは、UnicodeおよびISO/IEC 10646の、符号化フォームおよび符号化スキーム(文字符号化方式を参照)のひとつである。
注釈
- ^ UTFは、UnicodeではUnicode Transformation Formatの略、ISO/IEC 10646ではUCS Transformation Formatの略とされる。
出典
- ^ “The Unicode Standard Version 12.0” (PDF) (English). The Unicode Consortium. p. 131 (2019年3月). 2019年5月12日閲覧。 “The UTF-16 encoding scheme may or may not begin with a BOM. However,when there is no BOM, and in the absence of a higher-level protocol, the byteorder of the UTF-16 encoding scheme is big-endian.”
- ^ “FAQ - UTF-8, UTF-16, UTF-32 & BOM” (English). The Unicode Consortium (2017年6月27日). 2019年5月12日閲覧。
- 1 UTF-16とは
- 2 UTF-16の概要
- 3 符号化
- 4 比較
UTF-16
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/02/27 04:10 UTC 版)
「ISO/IEC 10646」の記事における「UTF-16」の解説
UnicodeのUTF-16と同じ。
※この「UTF-16」の解説は、「ISO/IEC 10646」の解説の一部です。
「UTF-16」を含む「ISO/IEC 10646」の記事については、「ISO/IEC 10646」の概要を参照ください。
- UTF-16のページへのリンク