ユニコードにおける拡張漢字
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/26 10:27 UTC 版)
「拡張漢字」の記事における「ユニコードにおける拡張漢字」の解説
ユニコードにおける拡張漢字とは、最初(1993年5月)に制定されたユニコードの規格であるUnicode 1.0に存在したCJK統合漢字、20,902字に対してまとまった形で追加されていった漢字集合のことを言い、以下のものがある。 CJK統合漢字拡張A (CJK Unified Ideographs Extension A) 1999年9月制定のUnicode 3.0(ISO/IEC 10646-1:2000に対応)において基本多言語面のU+3400-U+4DBFのブロック(Unicode 1.1までハングルを定義していた場所)に追加されたU+3400-U+4DB5の6,582字。当初は6,584文字の予定であったが、そのうち2文字が互換漢字領域にあったため、互換領域の2文字を拡張Aとして扱うことにして、この2文字は追加集合からは削除された。主として使用頻度の低い漢字が含まれ、JIS X 0213に一部対応しており、地名や人名などに用いられる漢字が含まれている。2020年3月のUnicode 13.0において、本ブロックにおいて文字が定義されていなかったU+4DB6-U+4DBFに10字が追加された。 CJK統合漢字拡張B (CJK Unified Ideographs Extension B) 2001年3月制定のUnicode 3.1(ISO/IEC 10646-2:2001に対応)において追加漢字面のU+20000-U+2A6FFのブロック(U+20000-U+2A6D6)に追加された漢字42,711字。Unicodeの拡張漢字集合では最も字数が多く、その大部分は日常ではまず用いられない漢字であるが、JIS X 0213に一部対応しており、地名や人名などに用いられる漢字が含まれている。また拡張B以降の集合には、かつてベトナムで用いられていたチュノムも含まれる。非常に膨大な漢字集合を極めて短期間のうちに定めたため、漢字の字形の重複や誤りが多数見られる。2020年3月のUnicode 13.0において、本ブロックに対してU+2A6D7-U+2A6DDの7字が追加された。 CJK統合漢字拡張C (CJK Unified Ideographs Extension C) 2008年12月に発行されたISO/IEC 10646:2003 (UCS) の追補5に含まれており、Unicode 5.2(2009年10月制定)から対応。符号位置は、追加漢字面のU+2A700-U+2B7FFの範囲が予約されていたが、実際に追加されたのはU+2A700-U+2B734の4,149文字。 CJK統合漢字拡張D (CJK Unified Ideographs Extension D) 2010年に発行されたISO/IEC 10646ではISO/IEC 10646:2010に含まれており、Unicode 6.0(2010年10月制定)から対応。符号位置は、追加漢字面のU+2B800-U+2F7FFの範囲が予約されていたが、実際に追加されたのはU+2B740-U+2B81Dの222字。 CJK統合漢字拡張E (CJK Unified Ideographs Extension E) 2014年9月に発行されたISO/IEC 10646:2014に含まれており、Unicode 8.0(2015年6月制定)から対応。符号位置は、追加漢字面のU+2B820-U+2CEA1の5,762字。 CJK統合漢字拡張F (CJK Unified Ideographs Extension F) 2017年に発行されたISO/IEC 10646:2017に含まれており、Unicode 10.0(2017年6月)から対応。符号位置は、追加漢字面のU+2CEB0-U+2EBEFの7,488字。文字基盤整備事業から提案された約1,800字や大蔵経テキストデータベース委員会から提案された約4,000字、さらにはチワン語やプイ語で用いられている伝統的な古壮字が含まれている。 CJK統合漢字拡張G (CJK Unified Ideographs Extension G) 2020年3月制定のUnicode 13.0に含まれている。符号位置は、第三漢字面のU+30000-U+3134Aの4,939字で、ここでUnicode史上初めて第三漢字面に正式に文字を割り当てている。 このほか、拡張G以降に追加することが計画されているものとして、拡張H・拡張Iがある。
※この「ユニコードにおける拡張漢字」の解説は、「拡張漢字」の解説の一部です。
「ユニコードにおける拡張漢字」を含む「拡張漢字」の記事については、「拡張漢字」の概要を参照ください。
- ユニコードにおける拡張漢字のページへのリンク