JIS・UCS (Unicode) の漢字コードとの関係
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/07/30 06:37 UTC 版)
「大漢和辞典」の記事における「JIS・UCS (Unicode) の漢字コードとの関係」の解説
大漢和辞典は日本の文字コードの策定にあたって、文字を同定するための参考図書として大きな影響を与えた。 1990年に制定されたJIS X 0212:1990および、2000年に制定されたJIS X 0213:2000年版のいずれにも、大漢和辞典の番号が参考情報として掲載されている。また、国際漢字符号標準化組織であるCJK-JRG(現在のISO/IEC JTC 1/SC 2/WG 2/IRG)が、1991年9月から12月にかけて日本・中国・台湾・韓国の漢字コードを整理して “Unified Repertoire and Ordering” (URO) を制定した際にも、文字の同定、および文字の並び順を決める際に、康熙字典と並んで大漢和辞典が利用された。その際、UROの20,902文字と大漢和辞典の番号との対応表が作成され、ISO/IEC 10646:1992の翻訳規格であるJIS X 0221:1995および2001の解説に掲載されている(2007年改正版では掲載は見送られた)。UROは、ISO/IEC 10646 (UCS) およびUnicodeの漢字コード表の基礎となった。 ISO/IEC 10646 (UCS) およびUnicodeでは、1998年から2017年にわたり拡張漢字A~F(Extension-A to F)として63,000字以上が制定されている。大漢和辞典との公式な対応表は作成されていないが、実際には大漢和辞典収録文字のほとんどが戸籍統一文字に収録されているため、これを経てUCS/Unicodeへ符号化されている。拡張漢字Fまでに符号化されていないものは、独立行政法人情報処理推進機構の調査によれば25字、京都大学漢字情報研究センターの安岡孝一によればおよそ22字であり、これらをすべて追加提案する予定であるという。 大漢和辞典では一部の当用漢字において、1点之繞と2点之繞の違いしかない漢字や、3画の草冠と4画の草冠の違いしかない漢字などにも個別に親字を配している。一方で、UCS/Unicodeでは、これらの字形の違いは区別せず、さらに音義が異なっていても字形が類似した漢字は統合している場合がある。そのため、大漢和辞典の親字をUCSで符号化するにあたってはおよそ500組程度の大漢和辞典の親字が同一符号となるが、こうした字体の区別をプレーンテキスト上で可能にさせるために異体字セレクタで対応している。
※この「JIS・UCS (Unicode) の漢字コードとの関係」の解説は、「大漢和辞典」の解説の一部です。
「JIS・UCS (Unicode) の漢字コードとの関係」を含む「大漢和辞典」の記事については、「大漢和辞典」の概要を参照ください。
- JIS・UCS の漢字コードとの関係のページへのリンク