UTF-8とは? わかりやすく解説

ユーティーエフ‐エイト【UTF-8】


UTF-8

フルスペル:8-bit UCS Transformation Format
読み方ユーティーエフエイト

UTF-8とは、Unicode16ビット文字セットを、8ビットバイト列に変換するための技術仕様のことである。UTF-8は8ビット可変長マルチバイト文字表現し、現在RFC 3629で定義されている。

UTF-8方式用いて文字列変換すると、Unicode最初128文字変換した結果ASCIIコードと全く同じくなる。そのため、旧来の処理システムとも親和性高く保つことができる。このときUTF-8は、英数1バイト表現し日本語は3バイト表現する。そのため、UTF-16比べるデータサイズ大きくなってしまうという面もあり、UTF-8とUTF-16に関して状況によって使い分ける必要がある


参照リンク
UTFとは何か
UCSとUTF
情報処理のほかの用語一覧
文字コード:  UTF  UTF-7  UTF-16  UTF-8  Unicode 10.0  Unicode 6.0
理論:  演繹的順序法

UTF-8

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/05/19 08:25 UTC 版)

UTF-8(ユーティーエフはち、ユーティーエフエイト)はISO/IEC 10646 (UCS) とUnicodeで使える8ビット符号単位(1–4バイトの可変長)の文字符号化形式および文字符号化スキーム


  1. ^ RFC 3629 UTF-8, a transformation format of ISO 10646
  2. ^ RFC 3629 Page-3
  3. ^ Rob Pike's UTF-8 history
  4. ^ ISO/IEC 10646:2003 Information technology -- Universal Multiple-Octet Coded Character Set (UCS)
  5. ^ RFC 2279 UTF-8, a transformation format of ISO 10646
  6. ^ The Unicode Standard, Version 5.2
  7. ^ RFC 3629 UTF-8, a transformation format of ISO 10646
  8. ^ ただし、バイト順マーク (BOM) が付加されている場合や、テキストを7ビットで処理するソフトウェア、内部的に最上位ビットを使用しているソフトウェアなど、使えないものも存在する
  9. ^ RFC 3629, pp.9f.
  10. ^ 10.1.10.6 The utf8mb4 Character Set (4-Byte UTF-8 Unicode Encoding)”. dev.mysql.com. MySQL 5.5 Reference Manual. Oracle. 2015年12月1日02:10:55時点のオリジナルよりアーカイブ。2015年12月11日閲覧。
  11. ^ Windowsにおける有名なワームであるNimdaウイルスは、IISにおけるUTF-8の脆弱性をもちいたものである。(はせがわようすけ 2009)
  12. ^ Mark Davis. “Forms of Unicode” (英語). IBM. 2005年5月6日時点のオリジナルよりアーカイブ。2013年9月18日閲覧。
  13. ^ このため、UTF-8という呼び名を使っていれば情報交換の相手が文書先頭にこのシーケンスがあると見なすと期待すべきではないし、また、UTF-8Nという呼び名は情報交換の際に用いるべきではない。
  14. ^ TeraPadEmEditorMIFESのようにBOMを付加するかどうかを選択できるものもある。
  15. ^ マイクロソフト・サポート https://support.microsoft.com/en-us/office/opening-csv-utf-8-files-correctly-in-excel-8a935af5-3416-4edd-ba7e-3dfd2bc4a032
  16. ^ /source-charset (Set Source Character Set) | Microsoft Docs
  17. ^ 「メモ帳」に多数の改善、BOMなしUTF-8がデフォルト保存形式に ~「Windows 10 19H1」”. Impress. 2023年1月26日閲覧。
  18. ^ RFC 3629 6. Byte order mark (BOM)



UTF-8

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/02/27 04:10 UTC 版)

ISO/IEC 10646」の記事における「UTF-8」の解説

UnicodeのUTF-8と同じ。

※この「UTF-8」の解説は、「ISO/IEC 10646」の解説の一部です。
「UTF-8」を含む「ISO/IEC 10646」の記事については、「ISO/IEC 10646」の概要を参照ください。

ウィキペディア小見出し辞書の「UTF-8」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「UTF-8」の関連用語

UTF-8のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



UTF-8のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
デジタル大辞泉デジタル大辞泉
(C)Shogakukan Inc.
株式会社 小学館
IT用語辞典バイナリIT用語辞典バイナリ
Copyright © 2005-2024 Weblio 辞書 IT用語辞典バイナリさくいん。 この記事は、IT用語辞典バイナリUTF-8の記事を利用しております。
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのUTF-8 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、WikipediaのISO/IEC 10646 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2024 GRAS Group, Inc.RSS