Unicode問題
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/19 18:20 UTC 版)
前述したように、既存の漢字で表記するのが困難な台湾語を、任意に創作した漢字で表記することがある。こうした文字はUnicode(およびそれに対応するISO/IEC 10646: 国際符号化文字集合)には収録されていないので、コンピュータ処理するときに問題が生じる。 白話字の場合は、声調符号を含め、ほとんど問題なくUnicodeで表記できる。2004年6月以前は、口を広く開ける母音o(oの右上に点を付けて表現する)がエンコードされていなかった。回避策として、中点 (· U+00B7) を使うか、組み合わせ文字の上点 ( ̇ U+0307) を使っていた。現在、前者は閩南語版ウィキペディアの表記において使われている。これらは理想からは程遠いので、1997年からISO-IEC 10646を担当するISO/IECワーキンググループ (ISO/IEC JTC 1/SC 2/WG2) に対し、新しい組み合わせ文字・上右点をエンコードするよう提案され、現在 COMBINING DOT ABOVE RIGHT ( ͘ U+0358) として正式に割り当てられている。対応フォントは「BabelStone Han」など。 台湾語の表記に必要な拡張注音符号も1999年にUnicode 3.0で Bopomofo Extended にU+31A0からU+31B7としてエンコードされた。2010年のUnicode 6.0でU+31B8からU+31BAまで3文字、2020年のUnicode 13.0でU+31BBからU+31BFまで5文字追加された。フォントの普及はこれからである。 Bopomofo Extended U+31A0 - U+31BFU+0123456789ABCDEF31A0ㆠ ㆡ ㆢ ㆣ ㆤ ㆥ ㆦ ㆧ ㆨ ㆩ ㆪ ㆫ ㆬ ㆭ ㆮ ㆯ 31B0ㆰ ㆱ ㆲ ㆳ ㆴ ㆵ ㆶ ㆷ ㆸ ㆹ ㆺ ㆻ ㆼ ㆽ ㆾ ㆿ
※この「Unicode問題」の解説は、「台湾語」の解説の一部です。
「Unicode問題」を含む「台湾語」の記事については、「台湾語」の概要を参照ください。
- Unicode問題のページへのリンク