ユーティーエフ‐エイト【UTF-8】
UTF-8
読み方:ユーティーエフエイト
UTF-8とは、Unicodeの16ビット文字セットを、8ビットのバイト列に変換するための技術仕様のことである。UTF-8は8ビットの可変長マルチバイトで文字を表現し、現在RFC 3629で定義されている。
UTF-8方式を用いて文字列を変換すると、Unicodeの最初の128文字を変換した結果がASCIIコードと全く同じくなる。そのため、旧来の処理システムとも親和性が高く保つことができる。このときUTF-8は、英数は1バイトで表現し、日本語は3バイトで表現する。そのため、UTF-16と比べるとデータのサイズが大きくなってしまうという面もあり、UTF-8とUTF-16に関しては状況によって使い分ける必要がある。
参照リンク
UTFとは何か
UCSとUTF
文字コード: | UTF UTF-7 UTF-16 UTF-8 Unicode 10.0 Unicode 6.0 |
理論: | 演繹的順序法 |
UTF-8
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/09/16 16:24 UTC 版)
UTF-8(ユーティーエフはち、ユーティーエフエイト)はISO/IEC 10646 (UCS) とUnicodeで使える8ビット符号単位(1–4バイトの可変長)の文字符号化形式および文字符号化スキーム。
- 1 UTF-8とは
- 2 UTF-8の概要
UTF-8
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/02/27 04:10 UTC 版)
「ISO/IEC 10646」の記事における「UTF-8」の解説
UnicodeのUTF-8と同じ。
※この「UTF-8」の解説は、「ISO/IEC 10646」の解説の一部です。
「UTF-8」を含む「ISO/IEC 10646」の記事については、「ISO/IEC 10646」の概要を参照ください。
- UTF-8のページへのリンク