JIS_X_0213とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > デジタル大辞泉 > JIS_X_0213の意味・解説 

ジスエックス‐ゼロにいちさん【JIS X 0213】

読み方:じすえっくすぜろにいちさん

平成12年2000)にJIS日本産業規格)で定めた符号化文字集合規格規格番号はJIS X 0213:2000通称JIS2000)。前身となるJIS X 0208拡張しJIS第3水準1259字、第4水準2436字を含む4344字を追加上位互換性をもつ。

[補説] 平成16年2004)に第2次規格JIS X 0213:2004通称JIS2004)に改正168字の字形変更JIS第3水準への10字の追加が行われ、非漢字1183字も含め合計1万1233字の字形規定された。平成24年2012)に第3次規格JIS X 0213:2012改正。→JIS漢字


JIS X 0213

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/11/13 19:34 UTC 版)

オイラー図(JIS X 0208、JIS X 0212、JIS X 0213等の漢字集合)

JIS X 0213は、JIS X 0208:1997を拡張した日本語用の符号化文字集合を規定する日本産業規格 (JIS) である。規格名称は「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」である[1]

2000年1月20日に制定、2004年2月20日、2012年2月20日に改正された[1]。2000年に制定されたJIS X 0213:2000は通称「JIS2000」と呼ばれている。2004年に改正されたJIS X 0213:2004は通称「JIS2004」と呼ばれている。

JIS X 0208を拡張した規格で、JIS X 0208が規定する6879字の図形文字の集合に対して、日本語の文字コードで運用する必要性の高い4354字が追加され、計1万1233字の図形文字を規定する。JIS X 0208を拡張する点においてJIS X 0212:1990と同目的であるが、JIS X 0212とJIS X 0213との間に互換性はない。JIS X 0212がJIS X 0208にない文字を集めた文字集合であるのに対し、JIS X 0213はJIS X 0208を包含し更に第三・第四水準漢字などを加えた上位集合である。

特徴

JIS X 0212(補助漢字)が頻度調査を中心に追加文字を選定し、典拠用例などは諸橋大漢和への参照情報を付加した程度だったのに対し、JIS X 0213ではJIS X 0208:1997 (JIS97) においてJIS X 0208の収載字体の用例・典拠を徹底して調べ上げ、同定したのと同様の手法で一般に使われる字(狭義の字体。以後「字」は狭義の「字体」を指す)でJIS X 0208に収録されていないものを追加した。そのため、JIS X 0212と同じ字が含まれていることもあるが、JIS X 0212では収録されていてもJIS X 0213では包摂規準を使って特に増やさなかった字がある。

拡張にあたっては、JIS X 0208の1997年改正で保留領域とされた部分に字を増やす方針で行われ、非漢字659字、第三水準として1249字、第四水準として2436字を追加した。実装では、JIS X 0208:1997で保留領域とされた部分に非漢字及び第三水準の文字を入れて第一とし、その後ろに第四水準の文字を第二面として加えた。さらに2004年の改正で、第三水準に10字が追加され、168字の例示字形が変更された。

第二面は第一面と同じく94区94点で構成されているが、そのうち文字の存在する符号領域は1, 3–5, 8, 12–15, 78–94区に限られる。この奇妙な配置はJIS X 0212補助漢字の存在する場所を避けた結果である。これによりEUCエンコードされた文章でJIS X 0212補助漢字を用いたものとJIS X 0213第二面を用いたものの判別が可能である。さらに両方を用いることも原理的には可能である(ただし、その規格は存在しない)。

しかし、JIS X 0208:1997で保留領域とされた部分は、過去のJIS X 0208で自由領域とされ、実装各社によって外字領域として使用されていた部分であり、実態としては既に使われている領域であった。ここに新たに文字を配置した規格案に対し実装各社側より意見があり、最終審査において各種符号化方式が「参考」(規格本体ではない)とされることになった。その一方で、JIS X 0208の空き領域を規定通り未使用としていたUNIX系ソフトウェアでは対応が比較的容易であり、複数の実装が存在する。

JIS X 0208に対して追加された文字の概略

文字の表記方法

JIS X 0213ではJIS X 0208まで用いられていた「区点」に「」を加え「面区点」となり、「面-区-点」でコード表記を行う。例えば1面3区33点の「A」は「1-3-33」とあらわす。

符号化方式

JISベースの文字コード

符号化方式は、ISO/IEC 2022にそった形のみ「規定」としてあり、ISO-2022-JP-2004Shift_JIS-2004EUC-JIS-2004は「参考」として記述がある。これらのコード名は今のところIANAが登録していないので、MIME等では "X-" で始まる私用の名称として用いる必要があることになる。 Shift_JIS-2004は、macOSJava 7などでは既に実装しているが、Windowsでは従来のシフトJIS(コードページ932)と互換性がないことを理由に実装していないため、広く利用することができない。

Unicodeとの対応

JIS X 0213制定当時はいくつかの文字に対応するUnicode符号が存在しなかったが、Unicode 3.1およびUnicode 3.2で追加された。ただし、符号化にあたり注意点がある。

サロゲートペア

  • 漢字の内CJK互換漢字領域に追加されたものを除くと基本多言語面 (BMP) 外のCJK統合漢字拡張Bに追加されることとなった。該当する文字は初版に302字、2004年追加分に1字の計303字ある。これらを使用する場合は、UTF-8では4バイト長コードに、UTF-16ではサロゲートペア(代用対)に対応する必要がある。UTF-32に対応している場合はそのまま使用可能である。
    • 例えば1面14区2点の点の付いた「𠀋」はU+2000Bに割り当てられた。

合成文字

  • 非漢字の内半濁点付き仮名、アクセント付き国際音声記号で従来のUnicodeに単独の符号としてないもの、声調の上昇調、下降調を示す記号は二つのUnicode符号を組み合わせて表すこととなった。該当する文字は全部で25字ある。これらをOpenTypeで使用するには、オペレーティングシステムやアプリケーションが、OpenTypeのグリフ置換機能に対応する必要がある(この場合グリフ置換のうち、複数の隣り合うグリフをある一つのグリフに置換する機能を使用)。
    • 例えば1面4区87点の半濁点付き「か゚」は「か」のU+304Bの後に合成用半濁点のU+309Aを付けて表すこととなった。
    • 1面11区69点の声調記号上昇調および1面11区70点声調記号下降調はU+02E5とU+02E9の組み合わせで表されるが、これはUnicode BookのChapter 7.8に基づくものである。これによると、U+02E5-U+02E9の5つの記号のうち複数が隣り合うと、上下の声調変化を示す記号ができるというものである。
˩˥(U+02E9 U+02E5)、˥˩(U+02E5 U+02E9)

CJK互換漢字の正規化

  • JIS X 0213とUnicodeでは包摂規準が異なる。そこで JIS X 0213 での人名用漢字の字形(字体)を区別するために、一部の文字をUnicodeではCJK互換漢字として収録している。CJK互換漢字は、Unicode正規化によりCJK統合漢字に分解(変換)される。この対応として互換漢字用の異体字セレクタ(SVS)を使用して変換前の情報を維持する必要がある。また、CJK統合漢字と字形選択子英語版の組み合わせを1文字として処理する必要もある。SVS対応フォントとしてはIPAexフォント、モリサワのAP版書体などがある。
    • 例えば、KS X 1001由来のCJK互換漢字が誤って入力された場合に、入力エラーとせずUnicode正規化処理で対処する方式(CJK統合漢字のみに変換)を採用すると、CJK互換漢字に収録されている人名用漢字が入力された場合に意図せず変換されてしまう。[3][4]
    • 例えば、(U+FA19)をUnicode正規化すると(U+795E)となる。これをSVSを使って 神︀(U+795E U+FE00)とすることで元のCJK互換漢字(の情報、字形)を維持する(SVSの数値文字参照に対応しない閲覧環境では表示が異なることに注意が必要[3])。

CJK互換漢字のIVS対応

  • CJK互換漢字やCJK統合漢字+SVSを使用せず、CJK統合漢字と字形選択子補助英語版の組み合わせ(IVS/IVD対応)により異体字(Unicodeでは包摂されるが、JIS X 0213として別の字体)を表現する場合、JIS X 0213の文字をこの組み合わせに変換する方法(複数あるため1つの方法を選んで変換)と、組み合わせを処理および表現(IVS対応フォントの導入)する必要がある。異体字セレクタ#実装も参照。
    • 例えば、IVSとしてAdobe-Japan1コレクションを使用すると(U+FA19)は神󠄀(U+795E U+E0100)となる。(游書体ヒラギノ花園フォントなどのIVS対応フォントが必要である)
    • 例えば、IVSとして文字情報基盤整備事業のMoji_Johoコレクションを使用すると(U+FA19)は神󠄃(U+795E U+E0103)となる。(IPAmj明朝花園フォントなどのIVS対応フォントが必要である)

各OSでの対応状況

なお、Windows Vista以降やmacOSではこれらに対応している。Windows XPではサロゲートペア(代用対)に対応しており、Service Pack 2以上を適用することによってグリフ置換にも対応する。Windows 2000はサロゲートペアに対応しているものの初期設定では無効化されておりレジストリの設定が必要である(Help:特殊文字#古代文字と人工文字参照)。またグリフ置換には未対応である。

アプリケーション側の対応も必要である。Microsoft OfficeのXP以降のバージョンやWindows Vistaに付属するInternet Explorer 7.0、Windows XP以降に付属するメモ帳やワードパッドなどでは対応済みである。

ほかの実装方法

  • JIS X 0213が制定されてすぐのころは、UnicodeにはJIS X 0213が実装されていなかったため、外字領域に文字を定義して使用することが多く行われていた。いくつかのフリーフォントではそのような実装が行われている[※ 1]
  • 日本のデータ放送などで使用されるARIB STD-B24では、ARIBの文字符号化方法の文字セットとしてJIS X 0213が使用可能となっている。「JIS互換漢字1面集合」でJIS X 0213:2004の1面、「JIS互換漢字2面集合」でJIS X 0213:2004の2面が使用される。この符号化方式の中には「国際符号化文字集合」を使用する方法があり、通常のUnicodeのマッピングのほか、「BMPセット」としてUnicodeでの「基本多言語面」で全てを表現できるようにJIS X 0213での「追加漢字面」の文字を「基本多言語面」の外字領域にマッピングしなおした文字セットが別に使用可能とされている。
  • JAVA 7では通常のShift_JIS-2004形式の実装(x-SJIS_0213)のほかShift_JIS-2004にMicrosoftコードページ932を上書きした符号化方式(x-MS932_0213)に対応している。

先行実装との互換性

JIS X 0213の第1面13区にはNEC特殊文字が、一部を除き同じ面区点番号で登録されている。NEC特殊文字はPC-9801やWindowsで幅広く使われていたにもかかわらず、機種依存文字であった。

JIS X 0213:2004の改正

表1: JIS X 0213:2004 により変更された文字
変更のあった文字
逢芦飴溢茨鰯淫迂厩噂餌襖迦牙廻恢晦葛鞄釜翰翫徽
祇汲笈卿饗僅喰櫛屑祁隙倦捲牽鍵諺巷梗鵠甑叉
榊薩鯖錆鮫餐杓灼酋楯薯藷哨鞘杖蝕訊逗摺撰煎煽穿箭
詮噌遡揃遜腿蛸辿樽歎註瀦捗槌鎚辻挺鄭擢溺兎堵屠賭
瀞遁謎灘楢禰牌這秤駁箸叛挽誹樋稗逼謬豹廟瀕斧蔽瞥
蔑篇娩鞭庖蓬鱒迄儲餅籾爺鑓愈猷漣煉簾榔
冤叟咬嘲
囀徘扁橙狡甦疼竈筵篝腱艘芒虔蜃蠅訝靱騙鴉
字体の変更前後の比較(GIFアニメ

例示字形の変更

JIS X 0213:2004は、JIS X 0213:2000の例示字形を変更している。変更があったのは表1の通りである。

全部で168字あり、おおむね、拡張新字体から、いわゆる康熙字典体型へ変更されている。「叉」や「釜」などは筆押さえを取っている。また、「蟹」(「解」と「虫」を離した)や「祟」(出を小さくした)などのように違いが分かりにくいものもある。

この変更は、国語審議会の答申「表外漢字字体表」に示されている字体に合わせるものである。ただし、文字コード規格とは文字の符号化表現を定めるものであり、例示字形は何ら規範的な役割を持たないことを謳っていながら、こうした変更を行うことに対して批判的な意見が公開レビューなどで寄せられた。

追加された10文字

表2: JIS X 0213:2004 で追加された文字
追加された10文字
俱剝𠮟吞噓姸屛幷瘦繫
従来の文字
倶剥叱呑嘘妍屏并痩繋

第3水準に追加された10字は表2の通りである。Unicodeで別の符号が与えられていたために追加されたものである。これらは表の下に示した従来の文字に対する異体字である。

フォントの対応

上記対応によりほぼ全てのOSにおいてJIS X 0213:2004の字形が標準で使用可能となった。

JIS X 0213:2004では、JIS X 0213:2004で規定されている全ての文字種が含まれていて、各文字がJIS X 0213:2004での包摂基準に従っており、JIS X 0213:2004で規定されているそれぞれの文字の区別がつけることができる(たとえばJIS X 0213:2004での異体字関係となる「神(片仮名の「ネ」の字形に似た示偏)」と「(漢字の「示」の字形の示偏)」が違う字形となっている)ことが求められているだけであり、例示字形と完全に同一の字形であることが求められているわけではないので、JIS X 0213:2004の包摂基準範囲内で自由に字形を選択してもJIS X 0213:2004に従った字形(たとえば「辻」が二点之繞でなくてもJIS X 0213に従った字形)ということができる。ただし、一般的にJIS X 0213:2004に従った字形のフォントとして発売されているフォントは、二点之繞や食偏なども含めてJIS X 0213:2004の例示字形に沿った字形を選択しているフォントがほとんどである。

JIS X 0213:2012の改正

2010年(平成22年)11月30日常用漢字表改定に対応して、引用例の変更、附属書12の追加がなされた[1]

注釈

  1. ^ [新漢字則 (JIS X 0213:2004)] にあるイオが作成した「Windows 9x/NT を JIS X 0213 対応にするパッチ」はそのような実装が行われている例である。
  2. ^ メイリオ」、「MS ゴシック3書体(MS ゴシック、MS Pゴシック、MS UI Gothic)」および「MS 明朝2書体(MS 明朝、MS P明朝)」がJIS X 0213:2004対応フォントである。
  3. ^ 2007年10月に公開したIPAフォントVer.2からJIS X0213:2004に準拠した。詳細はIPA フォント新シリーズの公開 (PDF) (2010年3月7日時点のアーカイブ)を参照。

出典

参考文献

  • 『JIS X 0213:2000 7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合』日本規格協会、東京、2000年1月。 (2000年1月20日制定)
  • 芝野耕司「JIS X 0213(7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合)の制定」『標準化ジャーナル』第30巻第3号、日本規格協会、東京、2000年3月、pp.3-7。 
  • 安岡孝一、安岡素子「JIS X 0212とJIS X 0213」『京都大学大型計算機センター研究セミナー報告』第64回、京都大学大型計算機センター、京都、2000年3月、pp.19-46。 2000年3月24日
  • 安岡孝一「JIS X 0213の符号化表現」『人文学と情報処理』第26号、勉誠出版、東京、2000年4月、pp.9-17。 
  • 芳賀進「JIS符号化文字集合の現在——非漢字(記号類)について」『人文学と情報処理』第26号、勉誠出版、東京、2000年4月、pp.18-22。 
  • 芝野耕司(編著)『増補改訂 JIS漢字字典』日本規格協会、2002年5月。ISBN 4-542-20129-5 
  • 『JIS X 0213:2004 7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合(追補1)』日本規格協会、東京、2004年2月。 2004年2月20日改正)
  • 佐藤敬幸「JIS X 0213(7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合)の改正について」『標準化ジャーナル』第34巻第4号、日本規格協会、東京、2004年4月、pp.8-12。 
  • 「人名用漢字の文字符号に関する規格検討会報告」『標準化ジャーナル』第34巻第11号、日本規格協会、東京、2004年11月、pp.10-11。 

関連項目

外部リンク


JIS X 0213

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/13 14:42 UTC 版)

JIS X 0208」の記事における「JIS X 0213」の解説

JIS X 0213(拡張漢字)は、JIS X 0208漢字集合拡張した漢字集合規定する規格票解説によれば、この文字集合は「JIS X 0208当初符号化意図していた現代日本語符号化するために十分な文字集合提供することを目的として設計された」ものであるJIS X 0208とJIS X 0213は併用されない。JIS X 0213の漢字集合は、JIS X 0208漢字集合表現できるすべての文字を含む、非漢字1,183文字および漢字10,050文字合計11,233文字からなり、JIS X 0213に規定され符号運用される。 JIS X 0213は一見するとJIS X 0208規定され符号化文字集合の上互換符号化文字集合規定または参考として提供しているように見える。しかし厳密にはJIS X 0213はJIS X 0208の上互換ではない。これはJIS X 0213の原案作成委員会認めるところである(JIS X 0213:2000規格票解説5.3.2、JIS X 0213:2000/追補1:2004規格票解説3.2.2)。 JIS X 0213がJIS X 0208の上互換でないというのは、JIS X 0213ではJIS X 0208一部区点位置について包摂分離おこなわれたというところによる。すなわちJIS X 0208において明示的に包摂されて一つ区点位置表現されていた相異なる字体対し、JIS X 0213ではそれぞれ独立の面区点位置与えられている場合がある。このためJIS X 0208符号によって符号化されたデータがJIS X 0213の符号変換できないことがある。 例えJIS X 02083346点(僧)には、「人偏に曽」の字体、「人偏に曾(第1画および第2画は「八」)」の字体および「人偏に曾(第1画および第2画は「ソ」)」の字体包摂されている。JIS X 0213ではこれについて包摂分離おこない1面3346点に「人偏に曽」および「人偏に曾(第1画および第2画は「ソ」)」を包摂して、1面14区41点を「人偏に曾(第1画および第2画は「八」)」とした。したがってJIS X 02083346点をJIS X 0213に移す際に、1面3346点と1面14区41点のいずれに移すべきかが機械的に定められない。 もっとも、現実にはJIS X 0208のm区n点とJIS X 0213の1面m区n点を一対一対応させることがおこなわれていて、それによって大きな混乱生じていない。大きな混乱がない理由としては、多く書体JIS X 0208例示字体ならった字体採用してきたこと、利用者多く包摂規準存在意識していないことなどが考えられる

※この「JIS X 0213」の解説は、「JIS X 0208」の解説の一部です。
「JIS X 0213」を含む「JIS X 0208」の記事については、「JIS X 0208」の概要を参照ください。

ウィキペディア小見出し辞書の「JIS_X_0213」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ

「JIS X 0213」の例文・使い方・用例・文例

Weblio日本語例文用例辞書はプログラムで機械的に例文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「JIS_X_0213」の関連用語

JIS_X_0213のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



JIS_X_0213のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
デジタル大辞泉デジタル大辞泉
(C)Shogakukan Inc.
株式会社 小学館
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのJIS X 0213 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、WikipediaのJIS X 0208 (改訂履歴)、五十音順 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。
Tanaka Corpusのコンテンツは、特に明示されている場合を除いて、次のライセンスに従います:
 Creative Commons Attribution (CC-BY) 2.0 France.
この対訳データはCreative Commons Attribution 3.0 Unportedでライセンスされています。
浜島書店 Catch a Wave
Copyright © 1995-2025 Hamajima Shoten, Publishers. All rights reserved.
株式会社ベネッセコーポレーション株式会社ベネッセコーポレーション
Copyright © Benesse Holdings, Inc. All rights reserved.
研究社研究社
Copyright (c) 1995-2025 Kenkyusha Co., Ltd. All rights reserved.
日本語WordNet日本語WordNet
日本語ワードネット1.1版 (C) 情報通信研究機構, 2009-2010 License All rights reserved.
WordNet 3.0 Copyright 2006 by Princeton University. All rights reserved. License
日外アソシエーツ株式会社日外アソシエーツ株式会社
Copyright (C) 1994- Nichigai Associates, Inc., All rights reserved.
「斎藤和英大辞典」斎藤秀三郎著、日外アソシエーツ辞書編集部編
EDRDGEDRDG
This page uses the JMdict dictionary files. These files are the property of the Electronic Dictionary Research and Development Group, and are used in conformance with the Group's licence.

©2025 GRAS Group, Inc.RSS