にバイト‐もじ【二バイト文字】
2バイト文字
別名:ダブルバイト文字
【英】Double Byte Character
2バイト文字とは、文字コードのうち、1文字を2バイトで表現する文字の総称である。一般的に、中国語、日本語、韓国語(CJK)の文字体系を指す場合が多い。
コンピュータにおいて、データは1バイトで256通りの情報を表現することができる。英語のアルファベットのような言語は、1バイトで充分に表現することができる。しかし、漢字のような言語は種類が膨大であるため、256種類では足りない。そのため、文字を表現するためにデータを2バイト利用し、256の2乗である65536通りの情報を表現可能とすることによって、実用的なレベルの文字表現を実現している。
2バイト文字に対して、アルファベットと記号を含んで1バイトで表現される文字は、1バイト文字と呼ばれる。日本語のワープロソフトでは、1バイト文字と2バイト文字を並存させることができる。
2バイト文字は、1バイト文字2個分の幅を持つ正方形に近い字形で表記される。このため、1バイト文字を半角、2バイト文字を全角と呼ぶこともある。2バイト文字の中には、英数字やカタカナといった、1バイト文字でも表現できる文字が含まれている。そのような、1バイト文字でも2バイト文字でも表現できる文字を区別するための表現として、半角カナ、全角英数字、などのように全角と半角の区別が利用されることが多い。
マルチバイト文字
(2バイト文字 から転送)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/01/27 01:41 UTC 版)
マルチバイト文字(マルチバイトもじ)とは、コンピュータ上で
2バイト文字
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/04/06 05:35 UTC 版)
「ISO/IEC 6937」の記事における「2バイト文字」の解説
基本文字に含まれないアルファベットは2バイトでコード化する。第1バイトは「字幅のないダイアクリティカルマーク」(non spacing diacritical mark)で、第2バイトの基本アルファベットにそのダイアクリティカルマークをつける。例えば、アキュート・アクセントつきの小文字のe (é)は「[字幅のないアキュート・アクセント] + e」として表現される。 ISO 6937の「字幅のないダイアクリティカルマーク」は以下の13種類である。 種類コード第2バイト生成結果グレイヴ・アクセント 0xC1 AEIOUaeiou ÀÈÌÒÙàèìòù アキュート・アクセント 0xC2 ACEILNORSUYZacegilnorsuyz ÁĆÉÍĹŃÓŔŚÚÝŹáćéģíĺńóŕśúýź サーカムフレックス 0xC3 ACEGHIJOSUWYaceghijosuwy ÂĈÊĜĤÎĴÔŜÛŴŶâĉêĝĥîĵôŝûŵŷ チルダ 0xC4 AINOUainou ÃĨÑÕŨãĩñõũ マクロン 0xC5 AEIOUaeiou ĀĒĪŌŪāēīōū ブレーヴェ 0xC6 AGUagu ĂĞŬăğŭ ドット 0xC7 CEGIZcegz ĊĖĠİŻċėġż トレマ(ウムラウト) 0xC8 AEIOUYaeiouy ÄËÏÖÜŸäëïöüÿ リング 0xCA AUau ÅŮåů セディーユ 0xCB CGKLNRSTcklnrst ÇĢĶĻŅŖŞŢçķļņŗşţ ダブルアキュート 0xCD OUou ŐŰőű オゴネク 0xCE AEIUaeiu ĄĘĮŲąęįų ハーチェク 0xCF CDELNRSTZcdelnrstz ČĎĚĽŇŘŠŤŽčďěľňřšťž
※この「2バイト文字」の解説は、「ISO/IEC 6937」の解説の一部です。
「2バイト文字」を含む「ISO/IEC 6937」の記事については、「ISO/IEC 6937」の概要を参照ください。
2バイト文字と同じ種類の言葉
- 2バイト文字のページへのリンク