UTF-16
読み方:ユーティーエフじゅうろく
UTF-16とは、Unicode、または、UCSを16ビットを単位とした可変長マルチバイトでエンコーディングする方式のことである。
2バイトで定義されているコード(U+0000~U+D7FFF、U+E000~U+FFFF)はそのままで、サロゲートペアで定義されているコードは4バイトにエンコードされる。
16ビットデータを全てのシステムで統一的に扱うためには、エンディアンの違いは避けては通れない問題である。UTF-16にもビッグエンディアン用のUTF-16BE、リトルエンディアン用のUTF-16LEがある。また、BOMによりエンディアンの指定も可能である。なお、BOMがないテキストはビッグエンディアンと解釈されることになっている。
参照リンク
RFC 2781 - UTF-16, an encoding of ISO 10646 - (英文)
文字コード: | Unicode UTF UTF-7 UTF-16 UTF-8 Unicode 10.0 Unicode 6.0 |
Weblioに収録されているすべての辞書からUTF-16を検索する場合は、下記のリンクをクリックしてください。

- UTF-16のページへのリンク