合成済み文字と分解された文字列の比較
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2017/08/16 07:58 UTC 版)
「合成済み文字」の記事における「合成済み文字と分解された文字列の比較」の解説
スウェーデン語で一般的な姓である Åström を例にして説明する。この単語を2通りの方法で表現する。1つ目は単一の符号位置である合成済みの Å(U+00C5)と ö(U+00F6)を使用し、2つ目はこれらをそれぞれ A(U+0041)とリング符号(U+030A)、 o(U+006F)とトレマ(U+0308)に分解した文字列で表す。 Åström (U+00C5 U+0073 U+0074 U+0072 U+00F6 U+006D) Åström (U+0041 U+030A U+0073 U+0074 U+0072 U+006F U+0308 U+006D) 2つの方法は等価であり、(色の違いを除いて)全く同じように表示されなければならない。しかし実際には、いくつかのUnicodeの実装では、まだ分解された文字が正しく表示されない。最悪の場合、ダイアクリティカルマークとの結合が無視されるか、基底文字の後に結合文字が文字化けして表示される。これは、全ての文字がフォントに含まれていないためである。問題の解決のため、いくつかアプリケーションは、単に分解された文字を等価の合成済み文字に置き換えようとする。 しかし、不完全なフォントでは、合成済み文字が問題を引き起こす場合がある。以下は、インド・ヨーロッパ祖語で「犬」を意味する単語の例である。 ḱṷṓn (U+1E31 U+1E77 U+1E53 U+006E) ḱṷṓn (U+006B U+0301 U+0075 U+032D U+006F U+0304 U+0301 U+006E) 緑色で表示した、合成済み文字によるダイアクリティカルマークつきのk, u, oが文字化けし、ダイアクリティカルマークつきでないnと別のフォントのように表示される場合がある。2行目では、組み合わせのダイアクリティカルマークが認識できなかったとしても、少くとも基底文字は正しく表示される。
※この「合成済み文字と分解された文字列の比較」の解説は、「合成済み文字」の解説の一部です。
「合成済み文字と分解された文字列の比較」を含む「合成済み文字」の記事については、「合成済み文字」の概要を参照ください。
- 合成済み文字と分解された文字列の比較のページへのリンク