シングルバイト文字との対比
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/12/04 15:18 UTC 版)
「マルチバイト文字」の記事における「シングルバイト文字との対比」の解説
符号化方式において、1文字が常に1バイトとなる符号化方式に対して、1文字が2バイト以上になることのある符号化方式、およびそれによって符号化された文字(列)のことを、マルチバイト文字(列)という。 実際には、ほぼ例外なく ASCII あるいは ISO 646 をベースとし、バイト値 80 - FF16進法(あるいはそのサブセット)で始まるバイト列によりそれ以外の文字集合を表現する。1文字のバイト数が可変のため、プログラムでの操作に留意を要する。 符号化方式であるから厳密には character set(文字集合) と呼ぶのは不正確だが、とくにIBMやマイクロソフトの用語として、single-byte character set(単バイト文字集合)、double-byte character set(2バイト文字集合)、multibyte character set(多バイト文字集合)と呼ぶことが多い。 以下のようなものがある。 Big5(コードページ950) EUC-CN(コードページ936) EUC-JP EUC-KR(コードページ949) ISO-2022-JP Shift_JIS(コードページ932/942) UTF-8(多バイト符号化方式)
※この「シングルバイト文字との対比」の解説は、「マルチバイト文字」の解説の一部です。
「シングルバイト文字との対比」を含む「マルチバイト文字」の記事については、「マルチバイト文字」の概要を参照ください。
- シングルバイト文字との対比のページへのリンク