CJK統合漢字
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/05/27 12:29 UTC 版)
CJK統合漢字の特徴と問題点
将来の予定
中国は『康熙字典』や、古壮字をはじめとする少数民族で使われている特殊漢字などの文字をすべてUCSに収録させようとしており、日本や韓国、ベトナムでも漢字(国字、韓国国字、チュノムなど)の追加提案があるため、Unicodeの今後のバージョンでは、CJK統合漢字の拡張ブロックが今後更に増加する可能性があり、また甲骨文などの古代の文字を、第三漢字面へ追加することが検討されている。
CJK互換漢字
U+F900~U+FAFFのブロックである。Unicode 3.1では補助集合として第2面(追加漢字面)にU+2F800~U+2FA1Fのブロックが追加された。基本的にCJK統合漢字と重複する漢字が割り当てられている。
CJK統合漢字には、基本的に一つの漢字に付き一つの符号位置しか与えられないため、KS X 1001など各国の規格で全く同じ形の漢字が重複して収録されていた場合、Unicodeとの相互変換を行った際可逆性が失われる事となる。(KS X 1001の場合、読みにより分離しているため、読みが分からなくなって困ることがある)。この問題を解決するために、このブロックが作られた。Big5で誤って重複してしまった2字もこのブロックにある。IBM拡張漢字のうちCJK統合漢字に入れなかったものもあり、その中にはU+FA1F(﨟)やU+FA24(﨤)などCJK統合漢字に同じ漢字が存在しないため、CJK統合漢字と同じ扱いをするものが12字ある。
Unicode 3.2では、JIS X 0213で包摂基準が変更され分離されたもののうち、「侮󠄁󠄁」や「僧󠄁󠄁」、「社󠄁」などUnicodeでは包摂されるものがこのブロックに追加された。これは、CJK統合漢字は日本以外にも中国と韓国の漢字を含めたものであり、日本だけのために包摂基準を変更して包摂分離して追加すると、他の国が国内規格と対応するUnicodeのコード値を変更しなければならないことがあるからである。例えば、「社󠄁」など⽰偏の漢字はGB 18030では偏が「⺭」の形を採用しているが、KS X 1001では偏が「⺭」でなく「⺬」の形を採用している。もし「社󠄁」を包摂分離してCJK統合漢字の新たな符号位置に追加したとすると、GB 18030はそのままでよいが、KS X 1001の「社󠄀」のコードとの対応は新たに追加された方に変更しなければならなくなる。
原規格
漢字のそれぞれの文字には、少なくとも一つの原典参照がある。[10]
注記 原典が更新されても、原典参照は、更新しない。更新された原典は、古い版に含まれていない文字の識別だけに用いてもよい。
原典 G
原典 G は、次のとおりに識別する。
- G0 GB 2312-80
- G1 GB 12345-90
- G3 GB 7589-87 繁体字
- G5 GB 7590-87 繁体字
- G7 現代漢語通用字表及び簡化字総表
- GS シンガポールにおける漢字
- G8 GB 8565-88
- G9 GB 18030-2000
- GE GB 16500-95
- GH GB 15564-1995 香港の一部の文字放送用の漢字体系
- GK GB 12052-89 情報交換用ハングル文字符号化文字情報
- G4K 四庫全書
- GBK 中国大百科全書
- GCE 国家教育研究院
- GCH 辞海
- GCY 辞源
- GCYY 中国測絵科学院用字
- GDM 中国公安省戸籍人名地名漢字
- GDZ 地質出版社用字
- GFC 現代漢語規範詞典第二版
- GFZ 方正排版系統
- GGFZ 通用規範漢字字典
- GGH 古代漢語詞典
- GHC 漢語大詞典
- GHF 漢文仏典疑難俗字彙釈与研究
- GHZ 漢語大字典
- GHZR 漢語大字典第二版
- GIDC 中国公安省 ID システム
- GIDCX 中国公安省 ID システム
- GJZ 商務印書館用字
- GKX 康熙字典及び康熙字典補遺
- GKJ Terms in Sciences and Technologies (科技用字) approved by the China National Committee for Terms in Sciences and Technologies (CNCTST)
- GLGYJ 壮族嘹歌研究
- GLK 龍龕手鑑
- GOCD オックスフォード英漢漢英詞典
- GPGLG 壮族民歌文化丛書•平果嘹歌
- GRM 人民日報の漢字
- GT 1983年標準電碼本(修訂本)
- GWZ Hanyu Da Cidian Press ideographs
- GXC 現代漢語詞典
- GXH 新華字典
- GXHZ 新華大字典
- GZ 古壮字字典
- GZFY 古代漢語詞典
- GZH 中華字海
- GZJW 殷周金文集成引得
- GZYS 壮族人民的文化遺産-方块壮字, 中国民族古文字研究
注記 康煕字典(GKX)として参照されている文字に対する符号表上での図形記号は、現在中国で使用されているものであり、康煕字典に示されている図形記号とは僅かに異なる場合がある。
原典 H
原典 H は、次のとおりに識別する。
- H 香港増補字符集 2008
- HB0 Big-5:計算機での中国語字形と文字符号との対応表, Technical Report C-26, 電脳用中文字型与字碼対照表, 技術通報 C-26, 1984, Symbols
- HB1 Big-5, Level 1
- HB2 Big-5, Level 2
- HD 香港増補字符集 2016
原典 M
原典 M は、次のとおりに識別する。
- MA HKSCS-2008
- MB1 Big Five
- MB2 Big Five
- MC MCSCS Reference
- MD MCSCS horizontal extensions
- MDH MCSCS horizontal extensions
- MAC Macao Information System Character Set(澳門資訊系統字集)
原典 T
原典 T は、次のとおりに識別する。
- T1 TCA-CNS 11643-1992 第 1 面
- T2 TCA-CNS 11643-1992 第 2 面
- T3 TCA-CNS 11643-1992 第 3 面及び幾つかの追加文字
- T4 TCA-CNS 11643-1992 第 4 面
- T5 TCA-CNS 11643-1992 第 5 面
- T6 TCA-CNS 11643-1992 第 6 面
- T7 TCA-CNS 11643-1992 第 7 面
- TA 化学命名原則(第四版)
- TB TCA-CNS 11643-2007 第 11 面
- TC TCA-CNS 11643-2007 第 12 面
- TD TCA-CNS 11643-2007 第 13 面
- TE TCA-CNS 11643-2007 第 14 面
- TF TCA-CNS 11643-2007 第 15 面
- T13 TCA-CNS 11643 19th plane (pending new version)
原典 J
原典 J は、次のとおりに識別する。
- J0 JIS X 0208-1990
- J1 JIS X 0212-1990
- J13 JIS X 0213:2004 level-3 characters replacing J1 characters
- J13A JIS X 0213:2004 level-3 character addendum from JIS X 0213:2000 level-3 replacing J1 character
- J14 JIS X 0213:2004 level-4 characters replacing J1 characters
- J3 JIS X 0213:2000 第 3 水準
- J3A JIS X 0213:2004 第 3 水準
- J4 JIS X 0213:2000 第 4 水準
- JA 国内5社漢字統合表,1993
- JA3 JIS X 0213:2004 level-3 characters replacing JA characters
- JA4 JIS X 0213:2004 level-4 characters replacing JA characters
- JH 汎用電子情報交換環境整備プログラム 2002〜2009
- JK 今昔文字鏡[11]
- JMJ 文字情報基盤整備事業
- JARIB 電波産業会 ARIB STD-B24 第 5.1 版,2007 年 3 月 14 日
原典 K
原典 K は、次のとおりに識別する。
- K0 KS X 1001:2004(以前は,KS C 5601-1987 であった。)
- K1 KS X 1002:2001(以前は,KS C 5657-1991 であった。)
- K2 PKS C 5700-1 1994
- K3 PKS C 5700-2 1994
- K4 PKS 5700-3:1998
- K5 Korean IRG Hanja Character Set 5th Edition: 2001
- K6 KS X 1027-5:2014
- KC Korean History On-Line
注記 K2,K3,K4 及び K5 に含まれる漢字は,新しい韓国規格群において改正作業が進んでいる。
原典 KP
原典 KP は、次のとおりに識別する。
- KP0 KPS 9566-97
- KP1 KPS 10721:2000及び KPS 10721:2003
原典 V
- V0 TCVN 5773:1993
- V1 TCVN 6056:1995
- V2 VHN 01:1998
- V3 VHN 02:1998
- V4 喃字詞典, 岱喃字字典, 沔南喃字榜査
- VN Vietnamese horizontal extensions
その他
- SAT SAT大正新脩大蔵経テキストデータベース
- UK Ideographic Rapporteur Group
- UTC ユニコード技術報告書 UTR #45, U-source Ideographs, May 2010
- ^ 英: universal multiple-octet coded character set
- ^ 英: CJK comptatibility ideograph
- ^ 英: Han character collection
- ^ 英: Joe Becker
- ^ 英: Lee Collins
- ^ 英: vertical supplementation
- ^ “Editorial corrigenda on CJK compatibility ideographs, and other items” (1998年11月30日). 2008年4月12日閲覧。
- ^ 英: internal supplementation
- ^ 英: horizontal supplementation
- ^ JIS X 0221:2014 国際符号化文字集合(UCS)
- ^ ケン・ランディ博士:JKは今昔文字鏡である。
- ^ 経済産業省 改元を目前に今すぐ実施すべき準備、対応とは 13ページ
- ^ IPAmj明朝フォント符号化の状況
- 1 CJK統合漢字とは
- 2 CJK統合漢字の概要
- 3 歴史
- 4 CJK統合漢字の特徴と問題点
- 5 書記素クラスタ
- 6 脚注
CJK統合漢字と同じ種類の言葉
- CJK統合漢字のページへのリンク