キャラクタとバイトとは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > キャラクタとバイトの意味・解説 

キャラクタとバイト

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/10/19 18:38 UTC 版)

キャラクタ (コンピュータ)」の記事における「キャラクタとバイト」の解説

キャラクタ符号化文字符号化方式)に、バイトこの段落ではオクテット同義)を当てるという標準確立し広く普及したのはIBM1964年4月発表したメインフレームSystem/360による(それ以前については#歴史の節を参照)。当初アナウンスでは制定されたばかりASCII採用されるはずだった。しかし、結果的に過去しがらみ振り切ることができず、メインフレーム用としてはEBCDIC普及した。なお、一応System/360モード切り替えることはできる。 C言語およびC++での文字型の名前はcharだが、このcharバイトオクテット等価ではない。C/C++char型の幅は/インクルードすることで定義されるCHAR_BITSというマクロで示され実際数値は8ではなく9や16可能性もある。なお、最低限必要とされている値の範囲の関係で8未満にはならないsizeof(char)は常に1である。バイト8ビットすなわちオクテットではない可能性もある。 幅を規定した整数型としてはC99およびC++11追加されたint8_t/uint8_tおよびstd::int8_t/std::uint8_tがある。C++20ではUTF-8エンコードされた文字格納することを想定した符号なし文字型として、char8_tが規定されたが、8ビット幅であるとは限らないJavaC#char16ビットであり、内部表現UTF-16規定されている。 コンピュータ普及米国次いで早かった[要出典]日本では日常の生活や業務漢字必須であるため、256より多くキャラクタ扱いたいという要求強かった。そこで現れたのが、1つキャラクタ複数バイトで表すマルチバイト文字MBC)である。特に初期には2バイトを使うものがほとんどであり、ダブルバイト文字DBCと言ったまた、米国以外の国や地域で、それぞれに必要な文字追加した文字集合文字コード作ったため、多数文字集合文字コード乱立する結果となったUnicodeはその問題解消し文字集合統一するために生まれた。 現在ではキャラクタデータの関係は抽象化されている。キャラクタ整数値(通常非負整数)で表現され、その整数値から文字符号化方式によりバイト列が生成される。たとえばUnicodeではUnicodeスカラ値という値が、各キャラクタに付けられている。

※この「キャラクタとバイト」の解説は、「キャラクタ (コンピュータ)」の解説の一部です。
「キャラクタとバイト」を含む「キャラクタ (コンピュータ)」の記事については、「キャラクタ (コンピュータ)」の概要を参照ください。

ウィキペディア小見出し辞書の「キャラクタとバイト」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「キャラクタとバイト」の関連用語

キャラクタとバイトのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



キャラクタとバイトのページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaのキャラクタ (コンピュータ) (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2024 GRAS Group, Inc.RSS