JIS X 0213 文字の表記方法

JIS X 0213

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/03/08 09:07 UTC 版)

文字の表記方法

JIS X 0213ではJIS X 0208まで用いられていた「区点」に「」を加え「面区点」となり、「面-区-点」でコード表記を行う。例えば1面3区33点の「A」は「1-3-33」とあらわす。

符号化方式

JISベースの文字コード

符号化方式は、ISO/IEC 2022にそった形のみ「規定」としてあり、ISO-2022-JP-2004Shift_JIS-2004EUC-JIS-2004は「参考」として記述がある。これらのコード名は今のところIANAが登録していないので、MIME等では "X-" で始まる私用の名称として用いる必要があることになる。 Shift_JIS-2004は、macOSJava 7などでは既に実装しているが、Windowsでは従来のシフトJIS(コードページ932)と互換性がないことを理由に実装していないため、広く利用することができない。

Unicodeとの対応

JIS X 0213制定当時はいくつかの文字に対応するUnicode符号が存在しなかったが、Unicode 3.1およびUnicode 3.2で追加された。ただし、符号化にあたり注意点がある。

サロゲートペア

  • 漢字の内CJK互換漢字領域に追加されたものを除くと基本多言語面 (BMP) 外のCJK統合漢字拡張Bに追加されることとなった。該当する文字は初版に302字、2004年追加分に1字の計303字ある。これらを使用する場合は、UTF-8では4バイト長コードに、UTF-16ではサロゲートペア(代用対)に対応する必要がある。UTF-32に対応している場合はそのまま使用可能である。
    • 例えば1面14区2点の点の付いた「𠀋」はU+2000Bに割り当てられた。

合成文字

  • 非漢字の内半濁点付き仮名、アクセント付き国際音声記号で従来のUnicodeに単独の符号としてないもの、声調の上昇調、下降調を示す記号は二つのUnicode符号を組み合わせて表すこととなった。該当する文字は全部で25字ある。これらをOpenTypeで使用するには、オペレーティングシステムやアプリケーションが、OpenTypeのグリフ置換機能に対応する必要がある(この場合グリフ置換のうち、複数の隣り合うグリフをある一つのグリフに置換する機能を使用)。
    • 例えば1面4区87点の半濁点付き「か゚」は「か」のU+304Bの後に合成用半濁点のU+309Aを付けて表すこととなった。
    • 1面11区69点の声調記号上昇調および1面11区70点声調記号下降調はU+02E5とU+02E9の組み合わせで表されるが、これはUnicode BookのChapter 7.8に基づくものである。これによると、U+02E5-U+02E9の5つの記号のうち複数が隣り合うと、上下の声調変化を示す記号ができるというものである。
˩˥(U+02E9 U+02E5)、˥˩(U+02E5 U+02E9)

CJK互換漢字の正規化

  • JIS X 0213とUnicodeでは包摂規準が異なる。そこで JIS X 0213 での人名用漢字の字形(字体)を区別するために、一部の文字をUnicodeではCJK互換漢字として収録している。CJK互換漢字は、Unicode正規化によりCJK統合漢字に分解(変換)される。この対応として互換漢字用の異体字セレクタ(SVS)を使用して変換前の情報を維持する必要がある。また、CJK統合漢字と字形選択子英語版の組み合わせを1文字として処理する必要もある。SVS対応フォントとしてはIPAexフォント、モリサワのAP版書体などがある。
    • 例えば、KS X 1001由来のCJK互換漢字が誤って入力された場合に、入力エラーとせずUnicode正規化処理で対処する方式(CJK統合漢字のみに変換)を採用すると、CJK互換漢字に収録されている人名用漢字が入力された場合に意図せず変換されてしまう。[3][4]
    • 例えば、(U+FA19)をUnicode正規化すると(U+795E)となる。これをSVSを使って 神︀(U+795E U+FE00)とすることで元のCJK互換漢字(の情報、字形)を維持する(SVSの数値文字参照に対応しない閲覧環境では表示が異なることに注意が必要[3])。

CJK互換漢字のIVS対応

  • CJK互換漢字やCJK統合漢字+SVSを使用せず、CJK統合漢字と字形選択子補助英語版の組み合わせ(IVS/IVD対応)により異体字(Unicodeでは包摂されるが、JIS X 0213として別の字体)を表現する場合、JIS X 0213の文字をこの組み合わせに変換する方法(複数あるため1つの方法を選んで変換)と、組み合わせを処理および表現(IVS対応フォントの導入)する必要がある。異体字セレクタ#実装も参照。
    • 例えば、IVSとしてAdobe-Japan1コレクションを使用すると(U+FA19)は神󠄀(U+795E U+E0100)となる。(游書体ヒラギノ花園フォントなどのIVS対応フォントが必要である)
    • 例えば、IVSとして文字情報基盤整備事業のMoji_Johoコレクションを使用すると(U+FA19)は神󠄃(U+795E U+E0103)となる。(IPAmj明朝花園フォントなどのIVS対応フォントが必要である)

各OSでの対応状況

なお、Windows Vista以降やmacOSではこれらに対応している。Windows XPではサロゲートペア(代用対)に対応しており、Service Pack 2以上を適用することによってグリフ置換にも対応する。Windows 2000はサロゲートペアに対応しているものの初期設定では無効化されておりレジストリの設定が必要である(Help:特殊文字#古代文字と人工文字参照)。またグリフ置換には未対応である。

アプリケーション側の対応も必要である。Microsoft OfficeのXP以降のバージョンやWindows Vistaに付属するInternet Explorer 7.0、Windows XP以降に付属するメモ帳やワードパッドなどでは対応済みである。

ほかの実装方法

  • JIS X 0213が制定されてすぐのころは、UnicodeにはJIS X 0213が実装されていなかったため、外字領域に文字を定義して使用することが多く行われていた。いくつかのフリーフォントではそのような実装が行われている[※ 1]
  • 日本のデータ放送などで使用されるARIB STD-B24では、ARIBの文字符号化方法の文字セットとしてJIS X 0213が使用可能となっている。「JIS互換漢字1面集合」でJIS X 0213:2004の1面、「JIS互換漢字2面集合」でJIS X 0213:2004の2面が使用される。この符号化方式の中には「国際符号化文字集合」を使用する方法があり、通常のUnicodeのマッピングのほか、「BMPセット」としてUnicodeでの「基本多言語面」で全てを表現できるようにJIS X 0213での「追加漢字面」の文字を「基本多言語面」の外字領域にマッピングしなおした文字セットが別に使用可能とされている。
  • JAVA 7では通常のShift_JIS-2004形式の実装(x-SJIS_0213)のほかShift_JIS-2004にMicrosoftコードページ932を上書きした符号化方式(x-MS932_0213)に対応している。

先行実装との互換性

JIS X 0213の第1面13区にはNEC特殊文字が、一部を除き同じ面区点番号で登録されている。NEC特殊文字はPC-9801やWindowsで幅広く使われていたにもかかわらず、機種依存文字であった。


  1. ^ [新漢字則 (JIS X 0213:2004)] にあるイオが作成した「Windows 9x/NT を JIS X 0213 対応にするパッチ」はそのような実装が行われている例である。
  2. ^ メイリオ」、「MS ゴシック3書体(MS ゴシック、MS Pゴシック、MS UI Gothic)」および「MS 明朝2書体(MS 明朝、MS P明朝)」がJIS X 0213:2004対応フォントである。
  3. ^ 2007年10月に公開したIPAフォントVer.2からJIS X0213:2004に準拠した。詳細はIPA フォント新シリーズの公開 (PDF) (2010年3月7日時点のアーカイブ)を参照。





英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「JIS X 0213」の関連用語

JIS X 0213のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



JIS X 0213のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのJIS X 0213 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2024 GRAS Group, Inc.RSS