CJK互換漢字
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/05/25 23:33 UTC 版)
CJK互換漢字ブロックにある定義誤り
CJK互換漢字ブロックにある定義誤りの文字で削除され、再定義されている。
符号位置 | 文字 | 備考 |
---|---|---|
U+F92C | 郎 | U+FA2Eで再定義 |
U+F9B8 | 隸 | U+FA2Fで再定義 |
U+FAD4 | 䀹 | U+2F949で再定義 |
日本語処理における問題点
CJK互換漢字はその名前にもかかわらずCJK統合漢字と互換等価ではなく正準等価であり、互いに区別されることを期待してはならない[8]。このため4種類の正規化のいずれを採用してもCJK統合漢字に分解(変換)されてしまい、日本の人名処理などにおいて要求されることのある一部の人名用漢字などの区別が、Unicodeのプレーンテキスト上で保証されるとは限らない。
一部にCJK互換漢字の等価性を正準等価から互換等価に変えるべきであるという主張があるが[9]、UnicodeではJIS X 0213用の互換漢字の一部は新たに収録せず、既存のKS X 1001互換文字用の領域などに収録されていた文字を流用している。このため日本語だけの都合で等価性を変えることはできない。またUnicodeには正規化の安定性の原則があり[10]、その意味でも等価性の変更は現実的ではない。
一方濁点・半濁点を合成済みの仮名文字(たとえば「が」)は、仮名文字に合成用濁点・半濁点を続けた文字の組み合わせ(たとえば「か」+「 ゙」)と同一視する需要がある。このため単純に正規化を行わなければ済む問題でもない。
Appleはこのジレンマを解決するため、CJK互換漢字を正規化から除外した新しい正規化形式の追加をUTC(Unicode Technical Committee, Unicode技術委員会)に提案したが、否決された[11]。そこでアップルはCJK互換漢字を含む一部の文字が分解されない独自の正規化形式を定め、自社のオペレーティングシステムに導入している[12]。
アドビは日本語の組版処理において必要とされる可能性がある字体の区別をCJK互換漢字に頼らずUnicodeのプレーンテキスト上で維持するために、Adobe-Japan1-6の異体字集合をUnicodeの漢字字形データベース (Ideographic Variation Database) に登録申請し[13]、2007年12月14日に登録された[14](詳細は異体字セレクタを参照)。
2013年9月制定のUnicode6.3ではこれとは別に基本多言語面の異体字セレクタを使用するStandardized Variantsとして、互換漢字用の異体字セレクタが登録された[15]。互換漢字ブロックおよびその補助集合にある統合漢字扱いする12字を除く1002文字全てを含んでいる。字形でなくKS X 1001の読みの違いによる重複収録やBig5の誤って重複収録されたものに対応する互換漢字も登録されている。[16]
JIS X 0213用の互換漢字一覧
以下にJIS X 0213用の互換漢字の一覧を示す。[17]
互換漢字 | 正規化後の代表字 | |||||
---|---|---|---|---|---|---|
面区点 | Unicode | 漢字 | 範疇 | 面区点 | Unicode | 漢字 |
KS X 1001由来の互換漢字 | ||||||
1-86-27 | U+F91D | 欄 | CJK互換漢字 | 1-45-83 | U+6B04 | 欄 |
1-84-14 | U+F928 | 廊 | CJK互換漢字 | 1-47-13 | U+5ECA | 廊 |
1-85-46 | U+F929 | 朗 | CJK互換漢字 | 1-47-15 | U+6717 | 朗 |
1-91-47 | U+F936 | 虜 | CJK互換漢字 | 1-46-26 | U+865C | 虜 |
1-86-41 | U+F970 | 殺 | CJK互換漢字 | 1-27-06 | U+6BBA | 殺 |
1-94-04 | U+F9D0 | 類 | CJK互換漢字 | 1-46-64 | U+985E | 類 |
1-93-61 | U+F9DC | 隆 | CJK互換漢字 | 1-46-20 | U+9686 | 隆 |
IBM拡張漢字由来の互換漢字 | ||||||
1-15-43 | U+FA0F | 﨏 | CJK統合漢字 | 正規化されない | ||
1-15-55 | U+FA10 | 塚 | CJK互換漢字 | 1-36-45 | U+585A | 塚 |
1-47-82 | U+FA11 | 﨑 | CJK統合漢字 | 正規化されない | ||
2-14-89 | U+FA13 | 﨓 | CJK統合漢字 | 正規化されない | ||
1-85-90 | U+FA14 | 﨔 | CJK統合漢字 | 正規化されない | ||
1-87-58 | U+FA15 | 凞 | CJK互換漢字 | 1-14-55 | U+51DE | 凞 |
1-87-79 | U+FA16 | 猪 | CJK互換漢字 | 1-35-86 | U+732A | 猪 |
1-89-28 | U+FA19 | 神 | CJK互換漢字 | 1-31-32 | U+795E | 神 |
1-89-29 | U+FA1A | 祥 | CJK互換漢字 | 1-30-45 | U+7965 | 祥 |
1-89-33 | U+FA1B | 福 | CJK互換漢字 | 1-42-01 | U+798F | 福 |
1-91-26 | U+FA1F | 﨟 | CJK統合漢字 | 正規化されない | ||
2-87-24 | U+FA20 | 蘒 | CJK互換漢字 | 1-91-36 | U+8612 | 蘒 |
2-87-37 | U+FA21 | 﨡 | CJK統合漢字 | 正規化されない | ||
1-92-14 | U+FA22 | 諸 | CJK互換漢字 | 1-29-84 | U+8AF8 | 諸 |
2-89-78 | U+FA24 | 﨤 | CJK統合漢字 | 正規化されない | ||
1-92-74 | U+FA26 | 都 | CJK互換漢字 | 1-37-52 | U+90FD | 都 |
JIS X 0213由来の互換漢字 | ||||||
1-14-24 | U+FA30 | 侮 | CJK互換漢字 | 1-41-78 | U+4FAE | 侮 |
1-14-41 | U+FA31 | 僧 | CJK互換漢字 | 1-33-46 | U+50E7 | 僧 |
1-14-48 | U+FA32 | 免 | CJK互換漢字 | 1-44-40 | U+514D | 免 |
1-14-67 | U+FA33 | 勉 | CJK互換漢字 | 1-42-57 | U+52C9 | 勉 |
1-14-72 | U+FA34 | 勤 | CJK互換漢字 | 1-22-48 | U+52E4 | 勤 |
1-14-78 | U+FA35 | 卑 | CJK互換漢字 | 1-40-60 | U+5351 | 卑 |
1-15-12 | U+FA36 | 喝 | CJK互換漢字 | 1-19-69 | U+559D | 喝 |
1-15-15 | U+FA37 | 嘆 | CJK互換漢字 | 1-35-18 | U+5606 | 嘆 |
1-15-22 | U+FA38 | 器 | CJK互換漢字 | 1-20-79 | U+5668 | 器 |
1-15-58 | U+FA39 | 塀 | CJK互換漢字 | 1-42-29 | U+5840 | 塀 |
1-15-62 | U+FA3A | 墨 | CJK互換漢字 | 1-43-47 | U+58A8 | 墨 |
1-47-65 | U+FA3B | 層 | CJK互換漢字 | 1-33-56 | U+5C64 | 層 |
1-47-66 | U+FA3C | 屮 | CJK互換漢字 | 1-54-05 | U+5C6E | 屮 |
1-84-48 | U+FA3D | 悔 | CJK互換漢字 | 1-18-89 | U+6094 | 悔 |
1-84-60 | U+FA3E | 慨 | CJK互換漢字 | 1-19-20 | U+6168 | 慨 |
1-84-62 | U+FA3F | 憎 | CJK互換漢字 | 1-33-94 | U+618E | 憎 |
1-84-65 | U+FA40 | 懲 | CJK互換漢字 | 1-36-08 | U+61F2 | 懲 |
1-85-08 | U+FA41 | 敏 | CJK互換漢字 | 1-41-50 | U+654F | 敏 |
1-85-11 | U+FA42 | 既 | CJK互換漢字 | 1-20-91 | U+65E2 | 既 |
1-85-35 | U+FA43 | 暑 | CJK互換漢字 | 1-29-75 | U+6691 | 暑 |
1-85-69 | U+FA44 | 梅 | CJK互換漢字 | 1-39-63 | U+6885 | 梅 |
1-86-73 | U+FA45 | 海 | CJK互換漢字 | 1-19-04 | U+6D77 | 海 |
1-86-87 | U+FA46 | 渚 | CJK互換漢字 | 1-29-77 | U+6E1A | 渚 |
1-87-05 | U+FA47 | 漢 | CJK互換漢字 | 1-20-33 | U+6F22 | 漢 |
1-87-53 | U+FA48 | 煮 | CJK互換漢字 | 1-28-49 | U+716E | 煮 |
2-80-09 | U+FA49 | 爫 | CJK互換漢字 | 2-80-10 | U+722B | 爫 |
1-88-05 | U+FA4A | 琢 | CJK互換漢字 | 1-34-86 | U+7422 | 琢 |
1-89-07 | U+FA4B | 碑 | CJK互換漢字 | 1-40-74 | U+7891 | 碑 |
1-89-19 | U+FA4C | 社 | CJK互換漢字 | 1-28-50 | U+793E | 社 |
1-89-20 | U+FA4D | 祉 | CJK互換漢字 | 1-27-67 | U+7949 | 祉 |
1-89-23 | U+FA4E | 祈 | CJK互換漢字 | 1-21-07 | U+7948 | 祈 |
1-89-24 | U+FA4F | 祐 | CJK互換漢字 | 1-45-20 | U+7950 | 祐 |
1-89-25 | U+FA50 | 祖 | CJK互換漢字 | 1-33-36 | U+7956 | 祖 |
1-89-27 | U+FA51 | 祝 | CJK互換漢字 | 1-29-43 | U+795D | 祝 |
1-89-31 | U+FA52 | 禍 | CJK互換漢字 | 1-18-50 | U+798D | 禍 |
1-89-32 | U+FA53 | 禎 | CJK互換漢字 | 1-36-87 | U+798E | 禎 |
1-89-45 | U+FA54 | 穀 | CJK互換漢字 | 1-25-82 | U+7A40 | 穀 |
1-89-49 | U+FA55 | 突 | CJK互換漢字 | 1-38-45 | U+7A81 | 突 |
1-89-68 | U+FA56 | 節 | CJK互換漢字 | 1-32-65 | U+7BC0 | 節 |
1-90-14 | U+FA57 | 練 | CJK互換漢字 | 1-46-93 | U+7DF4 | 練 |
2-84-48 | U+FA58 | 縉 | CJK互換漢字 | 1-69-54 | U+7E09 | 縉 |
1-90-19 | U+FA59 | 繁 | CJK互換漢字 | 1-40-43 | U+7E41 | 繁 |
1-90-26 | U+FA5A | 署 | CJK互換漢字 | 1-29-80 | U+7F72 | 署 |
1-90-36 | U+FA5B | 者 | CJK互換漢字 | 1-28-52 | U+8005 | 者 |
1-90-56 | U+FA5C | 臭 | CJK互換漢字 | 1-29-13 | U+81ED | 臭 |
2-85-84 | U+FA5D | 艹 | CJK互換漢字 | 2-85-86 | U+8279 | 艹 |
2-85-85 | U+FA5E | 艹 | CJK互換漢字 | 2-85-86 | U+8279 | 艹 |
1-91-07 | U+FA5F | 著 | CJK互換漢字 | 1-35-88 | U+8457 | 著 |
1-91-79 | U+FA60 | 褐 | CJK互換漢字 | 1-19-76 | U+8910 | 褐 |
1-91-89 | U+FA61 | 視 | CJK互換漢字 | 1-27-75 | U+8996 | 視 |
1-92-15 | U+FA62 | 謁 | CJK互換漢字 | 1-17-58 | U+8B01 | 謁 |
1-92-16 | U+FA63 | 謹 | CJK互換漢字 | 1-22-64 | U+8B39 | 謹 |
1-92-24 | U+FA64 | 賓 | CJK互換漢字 | 1-41-48 | U+8CD3 | 賓 |
1-92-29 | U+FA65 | 贈 | CJK互換漢字 | 1-34-03 | U+8D08 | 贈 |
2-89-73 | U+FA66 | 辶 | CJK互換漢字 | 2-89-74 | U+8FB6 | 辶 |
1-92-57 | U+FA67 | 逸 | CJK互換漢字 | 1-16-79 | U+9038 | 逸 |
1-93-67 | U+FA68 | 難 | CJK互換漢字 | 1-38-81 | U+96E3 | 難 |
1-93-86 | U+FA69 | 響 | CJK互換漢字 | 1-22-33 | U+97FF | 響 |
1-93-91 | U+FA6A | 頻 | CJK互換漢字 | 1-41-49 | U+983B | 頻 |
バージョン | コードポイント[a] | 文字数 | L2 ID | WG2 ID | IRG ID | ドキュメント |
---|---|---|---|---|---|---|
1.0.1 | U+F900..FA2D | 302 | (to be determined) | |||
L2/03-399 | Fok, Anthony (2003-10-13), Unihan reported errors / changes re kHKSCS entries | |||||
L2/03-367 | N2667 | Suignard, Michel; Muller, Eric; Jenkins, John (2003-10-22), CJK Ideograph source references corrections | ||||
L2/03-398 | Nguyen, D. (2003-10-29), Unihan reported errors / changes re kCowles | |||||
L2/03-417 | Muller, Eric (2003-10-31), Variation sequences for CJK Compatibility characters | |||||
L2/08-238 | Cook, Richard; Lunde, Ken (2008-06-09), Recommendation For IRG To Use IVD Collections | |||||
L2/08-373 | N3525 | Lunde, Ken; Muller, Eric (2008-10-06), Handling CJK compatibility characters with variation sequences | ||||
L2/08-425 | Cook, Richard; Lunde, Ken (2008-11-18), IRG Use of IVD Collections | |||||
L2/09-003R | Moore, Lisa (2009-02-12), UTC #118 / L2 #215 Minutes | |||||
L2/09-080 | N3590 | Muller, Eric (2009-03-11), Difficulties with compatibility ideographs | ||||
L2/09-290 | Muller, Eric (2009-08-07), Draft IVD registration for Compatibility Characters | |||||
L2/11-243 | N4111 | Sources for Orphaned CJK Ideographs, (2011-06-14) | ||||
3.2 | U+FA30..FA6A | 59 | L2/99-016 | N1935 | Paterson, Bruce (1998-11-30), Editorial corrigenda on CJK compatibility ideographs, and other items | |
L2/99-240 | Addition of fifty six KANJIs for compatibility, (1999-07-15) | |||||
L2/99-311 | Addition of fifty six KANJIs for compatibility, (1999-08-23) | |||||
L2/99-313 | N2095 | Sato, T. K. (1999-09-08), Addition of CJK ideographs which are already "unified" | ||||
L2/99-316 | Whistler, Ken (1999-09-13), Comments on JCS proposal | |||||
L2/99-322 | Collins, Lee (1999-10-11), Comments on JCS compatibility characters in L2/99-310 through L2/99-313 | |||||
L2/99-365 | Moore, Lisa (1999-11-23), Comments on JCS Proposals | |||||
L2/99-383 | N2142 | N710 | The response to WG2 resolution M37.16: CJK compatibility ideographs from JIS (WG2 N2104), (1999-12-09) | |||
L2/99-260R | Moore, Lisa (2000-02-07), Minutes of the UTC/L2 meeting in Mission Viejo, October 26-28, 1999 | |||||
L2/00-101 | N2197 | Sato, T. K. (2000-03-15), Update: CJK COMPATIBILITY IDEOGRAPH request | ||||
L2/00-172 | N2221R | Sato, T. K. (2000-04-20), JIS COMPATIBILITY IDEOGRAPHS (draft for ammendment-1) [sic] | ||||
L2/00-190 | Moore, Lisa (2000-06-22), UTC Rescinds Acceptance of Four Duplicate Radicals from JIS X 213 | |||||
L2/00-337 | N2273 | JIS compatibility ideographs, (2000-09-19) | ||||
L2/00-378 | N2295 | Sato, T. K. (2000-10-26), Feedback from Japan on N2281 -- working draft on pDAM 1 -- CJK Compatibility | ||||
4.1 | U+FA70..FAD9 | 106 | L2/00-317 | N2254R | Resolutions of WG2 Meeting 39 (Athens), (2000-10-11) | |
L2/01-350 | N2375 | Proposal to add 160 Compatibility Hanja code table of D P R of Korea into CJK Compatibility Ideographs, (2001-09-03) | ||||
N2375 | Proposal to add the 160 Compatibility Hanja code table of D P R of Korea into CJK Compatibility Ideographs, (2001-09-03) | |||||
N2478 | Proposed Disposition of comments on SC2 N 3584 (PDAM text for Amendment 2 to ISO/IEC 10646-1:2000), (2002-05-08) | |||||
L2/02-232 | N2493 | Sato, T. K.; Kobayashi, Tatsuo; Gi, Pak Tong (2002-05-22), Proposal to add 122 compatibility Hanja code table of the D P R of Korea into the CJK Compatibility Ideographs of ISO/IEC 10646-1:2000 | ||||
N2541 | Proposed disposition of comments on SC2 N 3624 (FPDAM text for Amendment 2 to ISO/IEC 10646-1:2000), (2002-12-02) | |||||
N2540 | Freytag, Asmus (2002-12-05), Corrections to CJK Compatibility Ideographs Table in FPDAM | |||||
L2/02-465 | N2566 | Collins, Lee; Freytag, Asmus (2002-12-09), Review of DPRK Compatibility Ideographs | ||||
L2/02-471 | N2572 | CJK Compatibility Ideographs (Unicode 3.2, page 399), (2002-12-18) | ||||
L2/02-472 | N2573 | Report of DPRK compatibility characters ad hoc meeting, (2002-12-11) | ||||
L2/02-468 | N2569 | Suignard, Michel (2002-12-12), Proposed disposition of comments on SC2 N 3624 (FPDAM text for Amendment 2 to ISO/IEC 10646-1:2000) | ||||
L2/03-023 | N2569R | Suignard, Michel (2003-01-27), Disposition of Comments Report on 10646-1/FPDAM 2 | ||||
L2/03-346 | Chang, Cora (2003-10-20), Analysis of characters in WG2 documents N2572, N2573 | |||||
L2/03-346.1 | Chang, Cora (2003-10-20), Analysis of characters in WG2 documents N2572, N2573 [spreadsheet without glyphs] | |||||
L2/04-207 | N2776 | N1062 | Proposal to add 106 Compatibility Hanjas of D P R of Korea to CJK Compatibility Ideographs, (2004-05-25) | |||
L2/04-330 | Whistler, Ken (2004-08-03), WG2 Consent Docket | |||||
L2/04-316 | Moore, Lisa (2004-08-19), UTC #100 Minutes | |||||
L2/05-050 | N2924R | Freytag, Asmus (2005-01-28), Charts - Amendments 1 and 2 to ISO/IEC 10646:2003 | ||||
L2/10-367 | N3899 | KP1-0000, (2010-09-30) | ||||
L2/11-243 | N4111 | Sources for Orphaned CJK Ideographs, (2011-06-14) | ||||
L2/11-254 | Constable, Peter (2011-06-20), UTC Liaison Report from WG2 | |||||
5.2 | U+FA6B..FA6D | 3 | L2/07-387 | Proposal to encode six CJK Ideographs in UCS, (2007-10-17) | ||
L2/08-184 | N3318R | Revised proposal to encode six CJK Ideographs in UCS, (2008-03-25) | ||||
6.1 | U+FA2E..FA2F | 2 | L2/10-087 | N3747 | A solution proposed by R.O.Korea for incorrectly mapped compatibility chars, (2010-03-19) | |
|
- ^ “Unicode character database”. The Unicode Standard. 2016年7月9日閲覧。
- ^ “Enumerated Versions of The Unicode Standard”. The Unicode Standard. 2016年7月9日閲覧。
- ^ 『CJKV日中韓越情報処理』オライリージャパン、2002年、120ページ
- ^ 安岡 孝一 (12 2001). “日本における最新文字コード事情”. システム/制御/情報 45 (12): p.688 .
- ^ 樋浦秀樹 (7 2000). “カナダに漢字を使う少数民族が!? Unicodeをめぐる不思議なものがたり”. 月刊ASCII: pp.169-170.
- ^ “Proposal to encode six CJK ideographs in UCS”. 2008年1月19日閲覧。
- ^ “Summary of repertoire for FPDAM 5 of ISO/IEC 10646:2003 and future amendments”. pp. pp.19-20. 2008年1月19日閲覧。
- ^ The Unicode Consortium (2006-11-03). The Unicode Standard, Version 5.0. Addison-Wesley Professional. pp. pp.71-72. ISBN 978-0-321-48091-0
- ^ “小形克宏の「文字の海、ビットの舟」 特別編25(8)番外編:改正JIS X 0213とUnicodeの等価性/正規化について(下)”. 2008年1月19日閲覧。
- ^ “Stability Policy for the Unicode Standard”. 2008年1月19日閲覧。
- ^ “PRI 7: Tailored normalization forms”. 2008年1月19日閲覧。
- ^ “Technical Note TN1150: HFS Plus Volume Format - Canonical Decomposition”. 2019年4月2日閲覧。
- ^ “PRI 108: Combined registration of the Adobe-Japan1 collection and of sequences in that collection”. 2008年1月19日閲覧。
- ^ “Ideographic Variation Database”. 2008年2月2日閲覧。
- ^ “CJK Type - Adobe Blogs / Standardized Variants — Part 1”. 2015年8月31日閲覧。 “同 - Part 2”. 2015年8月31日閲覧。 “同 - Part 3”. 2015年8月31日閲覧。
- ^ “Unicode Character Database: Standardized Variation Sequences”. The Unicode Consortium. 2019年4月28日閲覧。
- ^ “CJK Compatibility Ideographs (F900-FAFF) Character Code Chart”. 2012年8月25日閲覧。
- ^ KIM, Kyongsok (GIM, Gyeongseog) (2008年4月5日). “Lists of Duplicate Hanja Characters in KS X 1001 - (version 10: 2008.04.05)”. Korea JTC1/SC2 (Committee on Character Codes). 2008年4月30日閲覧。
- ^ 一般・頭音の区分は前掲資料により、間違いを一部訂正した。
CJK互換漢字と同じ種類の言葉
- CJK互換漢字のページへのリンク