文字集合と異体字
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/13 06:19 UTC 版)
JIS X 0208などの文字集合では基本的に情報交換用の文字を示すのが目的であるため、異体字ごとにコードポイントを割り振ったりはしないことが原則である(ただし固有名詞対応の必要性などから、複数の異体字に個別のコードが与えられているケースが多数見られる)。そのため、コンピュータ上で表示される文字はフォントを作る場合にその一例として採用した文字にすぎない。符号上は正しい文字だがフォントの関係上意図していた字体と違う場合も多く、異体字を包摂(一つのコードポイントに異体字を統合)せずに別にできる方法が必要という声もある。例えばいわゆる「髙=はしごだか」と「高=くちだか」では符号区点は一つしかないが、別のコードポイントを与えるべきだとの声もある。 Unicodeでも基本的に事情は同様であるがその一方でさまざまな既存の規格を取り込む際に「原規格分離 (source code separation) の原則」によって異体字に別のコードポイントが与えられたものもあり(「髙=はしごだか」と「高=くちだか」もこれに該当)、さらに混沌としている。 Unicodeでは、漢字の異体字の問題については「異体字タグ (variant tag)」の導入により包括的な解決を企図するとしていた。実際にUnicode 3.2では異体字タグは「異体字セレクタ(異体字選択子、字形選択子、英: Variation Selector)」という名称で16文字分 (U+FE00 - U+FE0F) が、Unicode 4.0では240文字分 (U+E0100 - U+E01EF) が追加された。規格書には「先行する1文字と組み合わせることによって、あらかじめ定義付けされた異なる字体を任意に選択できる」とあり、理屈の上では1文字につき256種類の異体字情報を持つことができるようになった。その後、2006年1月13日に漢字で異体字セレクタを使うための漢字字形データベース (Ideographic Variation Database) への登録手続きが定められ2007年12月14日に最初の異体字コレクションとしてAdobe-Japan1が登録された。なお、異体字セレクタのうち特に漢字に関するものは「IVS (Ideographic Variation Selector)」と呼ばれる。2009年、Windows 7、Mac OS X 10.6 (Snow Leopard) といったOSがIVSに対応、Adobe製品やJustsystem製品などが順次アプリケーションレベルでIVSに対応していった。Microsoft Officeは2013バージョンから正式にIVSに対応している(2007と2010はアドオンで対応)。 IVSなどに対応していない環境で、文字コードに依存せず異体字を切り替えるには以下のような手法が取られている。 フォント切り替え(裏フォント方式) 同じコードポイントに異体字を収録したフォントを複数(異体字の種類分)用意し、それによって字体の切り替えを行う。例えば「日本語・JIS90規格」「日本語・JIS2004規格」「中国語・簡体字」「中国語・繁体字(台湾)」「中国語・繁体字(香港)」「朝鮮語」のフォントにそれぞれ異なるグリフが含まれている組み合わせを挙げる。以下の字のうち背景色をグレーにした文字は他のタイプのフォントだと代用が利かない。 日本語中国語朝鮮語JIS90JIS2004簡体字繁体字台湾香港葛.mw-parser-output .jis90font{font-family:"Hiragino Kaku Gothic Pro","ヒラギノ角ゴ Pro","ヒラギノ角ゴ Pro W3","A-OTF 新ゴ Pro R","ヒラギノ角ゴ2","ヒラギノ角ゴ3","ヒラギノ角ゴ4","小塚ゴシック Pro R","小塚ゴシック Pro","SH G30-P","FC平成角ゴシック体","FA ゴシック","IPA モナー ゴシック","VL ゴシック","Droid Sans Japanese","MS PRゴシック","TGothic-GT01","東風ゴシック","さざなみゴシック","Komatuna","M+1P+IPAG","Mona","JSPゴシック","AR P丸ゴシック体M","EPSON 丸ゴシック体M","Osaka","CRPC&Gれいしっく","FGP平成明朝体W3","GT2000-01","和田研細丸ゴシック2000P","和田研細丸ゴシック2000P4",YOzFont90,YOzFontN90,"Yu Gothic UI","Meiryo UI";font-variant-east-asian:jis90}葛 葛 葛 葛 葛 葛 芒芒 芒 芒 芒 芒 芒 曜曜 曜 曜 曜 曜 曜 龍龍 龍 龍 龍 龍 龍 CIDフォント、OpenTypeフォントによる字体切り替え CIDフォントおよびその後継であるOpenTypeフォントは一つの文字コードに複数のグリフを関連付けさせたテーブルを内蔵しており、Adobe-Japan1文字集合に対応したOS、ウェブブラウザを含むアプリケーションで字体切り替えが可能となっている。 上記の手法はいずれもフォントに依存した異体字切り替えであり、異なった環境同士での情報交換にはフォント埋め込みなどの手段が必要とされる。フォント埋め込みができる文書フォーマットとしては「PDF」などが挙げられる。Adobe-Japan文字集合には未対応だが「Microsoft Word」もフォント埋め込みに対応している。
※この「文字集合と異体字」の解説は、「字体」の解説の一部です。
「文字集合と異体字」を含む「字体」の記事については、「字体」の概要を参照ください。
- 文字集合と異体字のページへのリンク