文字集合におけるマルチバイト文字
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/12/04 15:18 UTC 版)
「マルチバイト文字」の記事における「文字集合におけるマルチバイト文字」の解説
ISO 2022の体系を前提とした図形文字集合において、1文字が1バイトの文字集合(英: single-byte character set、94文字集合または96文字集合)に対して、1文字が2バイト以上の文字集合を、マルチバイト文字集合(英: multibyte character set)という。94×94文字集合(2バイト)、96×96文字集合(2バイト)、94×94×94文字集合(3バイト)などがこれに該当するが、実際には94×94文字集合以外はまれである。 特に、1文字が2バイトの文字集合を2バイト文字集合(英: double-byte character set)といい、以下のようなものがある。 GB 2312 JIS X 0208 (JIS C 6226) JIS X 0212 JIS X 0213 KS X 1001 (KS C 5601) KPS 9566 CNS 11643 なお、2バイト文字集合の文字のことを2バイト文字と呼ぶことがある。しかし、1バイト文字集合の文字であっても、EUC-JPにおけるJIS X 0201カタカナなどのように、符号化方式によっては一見1文字あたり2バイトであるかのような符号化をされることがある。また近年[いつ?]では、Unicode で処理することも多い。そのため、文字集合でなく個々の文字を指して1バイト文字・2バイト文字と表現することは、混乱を招くことがある。
※この「文字集合におけるマルチバイト文字」の解説は、「マルチバイト文字」の解説の一部です。
「文字集合におけるマルチバイト文字」を含む「マルチバイト文字」の記事については、「マルチバイト文字」の概要を参照ください。
- 文字集合におけるマルチバイト文字のページへのリンク