CJK互換漢字 CJK互換漢字ブロックにある定義誤り

Weblio 辞書 > 同じ種類の言葉 > 言葉 > 言葉 > 漢字 > CJK互換漢字の解説 > CJK互換漢字ブロックにある定義誤り 

CJK互換漢字

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/05/25 23:33 UTC 版)

CJK互換漢字ブロックにある定義誤り

CJK互換漢字ブロックにある定義誤りの文字で削除され、再定義されている。

符号位置 文字 備考
U+F92C U+FA2Eで再定義
U+F9B8 U+FA2Fで再定義
U+FAD4 U+2F949で再定義

日本語処理における問題点

CJK互換漢字はその名前にもかかわらずCJK統合漢字と互換等価ではなく正準等価であり、互いに区別されることを期待してはならない[8]。このため4種類の正規化のいずれを採用してもCJK統合漢字に分解(変換)されてしまい、日本の人名処理などにおいて要求されることのある一部の人名用漢字などの区別が、Unicodeのプレーンテキスト上で保証されるとは限らない。

一部にCJK互換漢字の等価性を正準等価から互換等価に変えるべきであるという主張があるが[9]、UnicodeではJIS X 0213用の互換漢字の一部は新たに収録せず、既存のKS X 1001互換文字用の領域などに収録されていた文字を流用している。このため日本語だけの都合で等価性を変えることはできない。またUnicodeには正規化の安定性の原則があり[10]、その意味でも等価性の変更は現実的ではない。

一方濁点半濁点を合成済みの仮名文字(たとえば「が」)は、仮名文字に合成用濁点・半濁点を続けた文字の組み合わせ(たとえば「か」+「 ゙」)と同一視する需要がある。このため単純に正規化を行わなければ済む問題でもない。

Appleはこのジレンマを解決するため、CJK互換漢字を正規化から除外した新しい正規化形式の追加をUTC(Unicode Technical Committee, Unicode技術委員会)に提案したが、否決された[11]。そこでアップルはCJK互換漢字を含む一部の文字が分解されない独自の正規化形式を定め、自社のオペレーティングシステムに導入している[12]

アドビ日本語組版処理において必要とされる可能性がある字体の区別をCJK互換漢字に頼らずUnicodeのプレーンテキスト上で維持するために、Adobe-Japan1-6の異体字集合をUnicodeの漢字字形データベース (Ideographic Variation Database) に登録申請し[13]2007年12月14日に登録された[14](詳細は異体字セレクタを参照)。

2013年9月制定のUnicode6.3ではこれとは別に基本多言語面の異体字セレクタを使用するStandardized Variantsとして、互換漢字用の異体字セレクタが登録された[15]。互換漢字ブロックおよびその補助集合にある統合漢字扱いする12字を除く1002文字全てを含んでいる。字形でなくKS X 1001の読みの違いによる重複収録やBig5の誤って重複収録されたものに対応する互換漢字も登録されている。[16]

JIS X 0213用の互換漢字一覧

以下にJIS X 0213用の互換漢字の一覧を示す。[17]

互換漢字 正規化後の代表字
面区点 Unicode 漢字 範疇 面区点 Unicode 漢字
KS X 1001由来の互換漢字
1-86-27 U+F91D CJK互換漢字 1-45-83 U+6B04
1-84-14 U+F928 CJK互換漢字 1-47-13 U+5ECA
1-85-46 U+F929 CJK互換漢字 1-47-15 U+6717
1-91-47 U+F936 CJK互換漢字 1-46-26 U+865C
1-86-41 U+F970 CJK互換漢字 1-27-06 U+6BBA
1-94-04 U+F9D0 CJK互換漢字 1-46-64 U+985E
1-93-61 U+F9DC CJK互換漢字 1-46-20 U+9686
IBM拡張漢字由来の互換漢字
1-15-43 U+FA0F CJK統合漢字 正規化されない
1-15-55 U+FA10 CJK互換漢字 1-36-45 U+585A
1-47-82 U+FA11 CJK統合漢字 正規化されない
2-14-89 U+FA13 CJK統合漢字 正規化されない
1-85-90 U+FA14 CJK統合漢字 正規化されない
1-87-58 U+FA15 CJK互換漢字 1-14-55 U+51DE
1-87-79 U+FA16 CJK互換漢字 1-35-86 U+732A
1-89-28 U+FA19 CJK互換漢字 1-31-32 U+795E
1-89-29 U+FA1A CJK互換漢字 1-30-45 U+7965
1-89-33 U+FA1B CJK互換漢字 1-42-01 U+798F
1-91-26 U+FA1F CJK統合漢字 正規化されない
2-87-24 U+FA20 CJK互換漢字 1-91-36 U+8612
2-87-37 U+FA21 CJK統合漢字 正規化されない
1-92-14 U+FA22 CJK互換漢字 1-29-84 U+8AF8
2-89-78 U+FA24 CJK統合漢字 正規化されない
1-92-74 U+FA26 CJK互換漢字 1-37-52 U+90FD
JIS X 0213由来の互換漢字
1-14-24 U+FA30 CJK互換漢字 1-41-78 U+4FAE
1-14-41 U+FA31 CJK互換漢字 1-33-46 U+50E7
1-14-48 U+FA32 CJK互換漢字 1-44-40 U+514D
1-14-67 U+FA33 CJK互換漢字 1-42-57 U+52C9
1-14-72 U+FA34 CJK互換漢字 1-22-48 U+52E4
1-14-78 U+FA35 CJK互換漢字 1-40-60 U+5351
1-15-12 U+FA36 CJK互換漢字 1-19-69 U+559D
1-15-15 U+FA37 CJK互換漢字 1-35-18 U+5606
1-15-22 U+FA38 CJK互換漢字 1-20-79 U+5668
1-15-58 U+FA39 CJK互換漢字 1-42-29 U+5840
1-15-62 U+FA3A CJK互換漢字 1-43-47 U+58A8
1-47-65 U+FA3B CJK互換漢字 1-33-56 U+5C64
1-47-66 U+FA3C CJK互換漢字 1-54-05 U+5C6E
1-84-48 U+FA3D CJK互換漢字 1-18-89 U+6094
1-84-60 U+FA3E CJK互換漢字 1-19-20 U+6168
1-84-62 U+FA3F 憎 CJK互換漢字 1-33-94 U+618E
1-84-65 U+FA40 CJK互換漢字 1-36-08 U+61F2
1-85-08 U+FA41 CJK互換漢字 1-41-50 U+654F
1-85-11 U+FA42 CJK互換漢字 1-20-91 U+65E2
1-85-35 U+FA43 CJK互換漢字 1-29-75 U+6691
1-85-69 U+FA44 CJK互換漢字 1-39-63 U+6885
1-86-73 U+FA45 CJK互換漢字 1-19-04 U+6D77
1-86-87 U+FA46 CJK互換漢字 1-29-77 U+6E1A
1-87-05 U+FA47 CJK互換漢字 1-20-33 U+6F22
1-87-53 U+FA48 CJK互換漢字 1-28-49 U+716E
2-80-09 U+FA49 CJK互換漢字 2-80-10 U+722B
1-88-05 U+FA4A CJK互換漢字 1-34-86 U+7422
1-89-07 U+FA4B CJK互換漢字 1-40-74 U+7891
1-89-19 U+FA4C CJK互換漢字 1-28-50 U+793E
1-89-20 U+FA4D CJK互換漢字 1-27-67 U+7949
1-89-23 U+FA4E CJK互換漢字 1-21-07 U+7948
1-89-24 U+FA4F CJK互換漢字 1-45-20 U+7950
1-89-25 U+FA50 CJK互換漢字 1-33-36 U+7956
1-89-27 U+FA51 CJK互換漢字 1-29-43 U+795D
1-89-31 U+FA52 CJK互換漢字 1-18-50 U+798D
1-89-32 U+FA53 CJK互換漢字 1-36-87 U+798E
1-89-45 U+FA54 CJK互換漢字 1-25-82 U+7A40
1-89-49 U+FA55 CJK互換漢字 1-38-45 U+7A81
1-89-68 U+FA56 CJK互換漢字 1-32-65 U+7BC0
1-90-14 U+FA57 CJK互換漢字 1-46-93 U+7DF4
2-84-48 U+FA58 CJK互換漢字 1-69-54 U+7E09
1-90-19 U+FA59 CJK互換漢字 1-40-43 U+7E41
1-90-26 U+FA5A CJK互換漢字 1-29-80 U+7F72
1-90-36 U+FA5B CJK互換漢字 1-28-52 U+8005
1-90-56 U+FA5C CJK互換漢字 1-29-13 U+81ED
2-85-84 U+FA5D CJK互換漢字 2-85-86 U+8279
2-85-85 U+FA5E CJK互換漢字 2-85-86 U+8279
1-91-07 U+FA5F CJK互換漢字 1-35-88 U+8457
1-91-79 U+FA60 CJK互換漢字 1-19-76 U+8910
1-91-89 U+FA61 CJK互換漢字 1-27-75 U+8996
1-92-15 U+FA62 CJK互換漢字 1-17-58 U+8B01
1-92-16 U+FA63 CJK互換漢字 1-22-64 U+8B39
1-92-24 U+FA64 CJK互換漢字 1-41-48 U+8CD3
1-92-29 U+FA65 CJK互換漢字 1-34-03 U+8D08
2-89-73 U+FA66 CJK互換漢字 2-89-74 U+8FB6
1-92-57 U+FA67 CJK互換漢字 1-16-79 U+9038
1-93-67 U+FA68 CJK互換漢字 1-38-81 U+96E3
1-93-86 U+FA69 CJK互換漢字 1-22-33 U+97FF
1-93-91 U+FA6A CJK互換漢字 1-41-49 U+983B

バージョン コードポイント[a] 文字数 L2 ID WG2 ID IRG ID ドキュメント
1.0.1 U+F900..FA2D 302 (to be determined)
L2/03-399 Fok, Anthony (2003-10-13), Unihan reported errors / changes re kHKSCS entries 
L2/03-367 N2667 Suignard, Michel; Muller, Eric; Jenkins, John (2003-10-22), CJK Ideograph source references corrections 
L2/03-398 Nguyen, D. (2003-10-29), Unihan reported errors / changes re kCowles 
L2/03-417 Muller, Eric (2003-10-31), Variation sequences for CJK Compatibility characters 
L2/08-238 Cook, Richard; Lunde, Ken (2008-06-09), Recommendation For IRG To Use IVD Collections 
L2/08-373 N3525 Lunde, Ken; Muller, Eric (2008-10-06), Handling CJK compatibility characters with variation sequences 
L2/08-425 Cook, Richard; Lunde, Ken (2008-11-18), IRG Use of IVD Collections 
L2/09-003R Moore, Lisa (2009-02-12), UTC #118 / L2 #215 Minutes 
L2/09-080 N3590 Muller, Eric (2009-03-11), Difficulties with compatibility ideographs 
L2/09-290 Muller, Eric (2009-08-07), Draft IVD registration for Compatibility Characters 
L2/11-243 N4111 Sources for Orphaned CJK Ideographs, (2011-06-14) 
3.2 U+FA30..FA6A 59 L2/99-016 N1935 Paterson, Bruce (1998-11-30), Editorial corrigenda on CJK compatibility ideographs, and other items 
L2/99-240 Addition of fifty six KANJIs for compatibility, (1999-07-15) 
L2/99-311 Addition of fifty six KANJIs for compatibility, (1999-08-23) 
L2/99-313 N2095 Sato, T. K. (1999-09-08), Addition of CJK ideographs which are already "unified" 
L2/99-316 Whistler, Ken (1999-09-13), Comments on JCS proposal 
L2/99-322 Collins, Lee (1999-10-11), Comments on JCS compatibility characters in L2/99-310 through L2/99-313 
L2/99-365 Moore, Lisa (1999-11-23), Comments on JCS Proposals 
L2/99-383 N2142 N710 The response to WG2 resolution M37.16: CJK compatibility ideographs from JIS (WG2 N2104), (1999-12-09) 
L2/99-260R Moore, Lisa (2000-02-07), Minutes of the UTC/L2 meeting in Mission Viejo, October 26-28, 1999 
L2/00-101 N2197 Sato, T. K. (2000-03-15), Update: CJK COMPATIBILITY IDEOGRAPH request 
L2/00-172 N2221R Sato, T. K. (2000-04-20), JIS COMPATIBILITY IDEOGRAPHS (draft for ammendment-1) [sic] 
L2/00-190 Moore, Lisa (2000-06-22), UTC Rescinds Acceptance of Four Duplicate Radicals from JIS X 213 
L2/00-337 N2273 JIS compatibility ideographs, (2000-09-19) 
L2/00-378 N2295 Sato, T. K. (2000-10-26), Feedback from Japan on N2281 -- working draft on pDAM 1 -- CJK Compatibility 
4.1 U+FA70..FAD9 106 L2/00-317 N2254R Resolutions of WG2 Meeting 39 (Athens), (2000-10-11) 
L2/01-350 N2375 Proposal to add 160 Compatibility Hanja code table of D P R of Korea into CJK Compatibility Ideographs, (2001-09-03) 
N2375 Proposal to add the 160 Compatibility Hanja code table of D P R of Korea into CJK Compatibility Ideographs, (2001-09-03) 
N2478 Proposed Disposition of comments on SC2 N 3584 (PDAM text for Amendment 2 to ISO/IEC 10646-1:2000), (2002-05-08) 
L2/02-232 N2493 Sato, T. K.; Kobayashi, Tatsuo; Gi, Pak Tong (2002-05-22), Proposal to add 122 compatibility Hanja code table of the D P R of Korea into the CJK Compatibility Ideographs of ISO/IEC 10646-1:2000 
N2541 Proposed disposition of comments on SC2 N 3624 (FPDAM text for Amendment 2 to ISO/IEC 10646-1:2000), (2002-12-02) 
N2540 Freytag, Asmus (2002-12-05), Corrections to CJK Compatibility Ideographs Table in FPDAM 
L2/02-465 N2566 Collins, Lee; Freytag, Asmus (2002-12-09), Review of DPRK Compatibility Ideographs 
L2/02-471 N2572 CJK Compatibility Ideographs (Unicode 3.2, page 399), (2002-12-18) 
L2/02-472 N2573 Report of DPRK compatibility characters ad hoc meeting, (2002-12-11) 
L2/02-468 N2569 Suignard, Michel (2002-12-12), Proposed disposition of comments on SC2 N 3624 (FPDAM text for Amendment 2 to ISO/IEC 10646-1:2000) 
L2/03-023 N2569R Suignard, Michel (2003-01-27), Disposition of Comments Report on 10646-1/FPDAM 2 
L2/03-346 Chang, Cora (2003-10-20), Analysis of characters in WG2 documents N2572, N2573 
L2/03-346.1 Chang, Cora (2003-10-20), Analysis of characters in WG2 documents N2572, N2573 [spreadsheet without glyphs] 
L2/04-207 N2776 N1062 Proposal to add 106 Compatibility Hanjas of D P R of Korea to CJK Compatibility Ideographs, (2004-05-25) 
L2/04-330 Whistler, Ken (2004-08-03), WG2 Consent Docket 
L2/04-316 Moore, Lisa (2004-08-19), UTC #100 Minutes 
L2/05-050 N2924R Freytag, Asmus (2005-01-28), Charts - Amendments 1 and 2 to ISO/IEC 10646:2003 
L2/10-367 N3899 KP1-0000, (2010-09-30) 
L2/11-243 N4111 Sources for Orphaned CJK Ideographs, (2011-06-14) 
L2/11-254 Constable, Peter (2011-06-20), UTC Liaison Report from WG2 
5.2 U+FA6B..FA6D 3 L2/07-387 Proposal to encode six CJK Ideographs in UCS, (2007-10-17) 
L2/08-184 N3318R Revised proposal to encode six CJK Ideographs in UCS, (2008-03-25) 
6.1 U+FA2E..FA2F 2 L2/10-087 N3747 A solution proposed by R.O.Korea for incorrectly mapped compatibility chars, (2010-03-19) 
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。
  1. ^ Unicode character database”. The Unicode Standard. 2016年7月9日閲覧。
  2. ^ Enumerated Versions of The Unicode Standard”. The Unicode Standard. 2016年7月9日閲覧。
  3. ^ 『CJKV日中韓越情報処理』オライリージャパン、2002年、120ページ
  4. ^ 安岡 孝一 (12 2001). “日本における最新文字コード事情”. システム/制御/情報 45 (12): p.688. http://www.kanji.zinbun.kyoto-u.ac.jp/~yasuoka/publications/ISCIE2001.pdf. 
  5. ^ 樋浦秀樹 (7 2000). “カナダに漢字を使う少数民族が!? Unicodeをめぐる不思議なものがたり”. 月刊ASCII: pp.169-170. 
  6. ^ Proposal to encode six CJK ideographs in UCS”. 2008年1月19日閲覧。
  7. ^ Summary of repertoire for FPDAM 5 of ISO/IEC 10646:2003 and future amendments”. pp. pp.19-20. 2008年1月19日閲覧。
  8. ^ The Unicode Consortium (2006-11-03). The Unicode Standard, Version 5.0. Addison-Wesley Professional. pp. pp.71-72. ISBN 978-0-321-48091-0. http://www.unicode.org/versions/Unicode5.0.0/ch03.pdf#G22672 
  9. ^ 小形克宏の「文字の海、ビットの舟」 特別編25(8)番外編:改正JIS X 0213とUnicodeの等価性/正規化について(下)”. 2008年1月19日閲覧。
  10. ^ Stability Policy for the Unicode Standard”. 2008年1月19日閲覧。
  11. ^ PRI 7: Tailored normalization forms”. 2008年1月19日閲覧。
  12. ^ Technical Note TN1150: HFS Plus Volume Format - Canonical Decomposition”. 2019年4月2日閲覧。
  13. ^ PRI 108: Combined registration of the Adobe-Japan1 collection and of sequences in that collection”. 2008年1月19日閲覧。
  14. ^ Ideographic Variation Database”. 2008年2月2日閲覧。
  15. ^ CJK Type - Adobe Blogs / Standardized Variants — Part 1”. 2015年8月31日閲覧。 同 - Part 2”. 2015年8月31日閲覧。 同 - Part 3”. 2015年8月31日閲覧。
  16. ^ Unicode Character Database: Standardized Variation Sequences”. The Unicode Consortium. 2019年4月28日閲覧。
  17. ^ CJK Compatibility Ideographs (F900-FAFF) Character Code Chart”. 2012年8月25日閲覧。
  18. ^ KIM, Kyongsok (GIM, Gyeongseog) (2008年4月5日). “Lists of Duplicate Hanja Characters in KS X 1001 - (version 10: 2008.04.05)”. Korea JTC1/SC2 (Committee on Character Codes). 2008年4月30日閲覧。
  19. ^ 一般・頭音の区分は前掲資料により、間違いを一部訂正した。






CJK互換漢字と同じ種類の言葉


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「CJK互換漢字」の関連用語

CJK互換漢字のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



CJK互換漢字のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのCJK互換漢字 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2024 GRAS Group, Inc.RSS