タイ語のコンピュータ処理
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/07/07 00:45 UTC 版)
タイ文字の記述方法が複雑であるため、タイ語では複雑なコンピュータ処理を必要とする。 タイ文字は子音と母音に分かれた表音文字であるが、母音の位置が子音に対して上下左右の四方向あり、上部に記号を複数、縦方向に書くこともある。縦方向にも母音と記号が伸びるため、正しくタイ文字を表示させるには上下に十分なスペースが必要である。上下方向に十分なスペースをとるにはラテン文字や漢字などの文字の二行から三行分が必要であるが、文章によっては必ずしも上下方向に文字が伸びるとも限らず、伸びても一部の文字だけである。最初は上下方向に少ない領域を取り、上下方向に伸びた場合、上下の領域が広がるという処理をしているアプリケーションもあるが、こういう複雑な処理をしているアプリケーションは少ない。そのため、コンピュータの表示では上部または下部が欠けて見えない場合がある。 IE, Mozilla, Firefoxなどのウェブブラウザの一行入力欄でも、タイ文字の下部が欠けて見えないなどの問題が起こる。キーボード入力は、直接その文字に対応するキーを打つ方式をとっているが、文字数が多くシフトキーを多用するため慣れるのには時間がかかる。 上下にも文字が伸びるため、内部表現における順序の統一やカーソル位置の処理も難しい。上下に複数の母音・声調等の記号が伸びる場合、打つ順番が違うと、表示上は同じになるにもかかわらず内部表現上でのコードの配列順序が異なることがある。この場合、同じ単語・同じ表示であるのに内部表現が異なるため、カーソルがユーザの意図と異なる動きをしたり、検索や置換などの処理が困難になる場合がある。最近では子音、母音、その他補助記号が順序通りに並べられないと正しく表示されないようになっているプログラムもあるが、すべてのプログラムで統一されているわけではない。このようにタイ語はコンピューター処理では発展途上である。文字に似た共通点のあるラオス語、カンボジア語も、同様の問題を持っている。 またタイ文字は単語と単語の間にスペースを入れないために、自動的に単語の終わりで改行させること(ワードラップ)が困難である。文章作成ソフトウェアでは、辞書を用いたり文法解析を行ってワードラップを行っている。より簡易的にはZero-width spaceという制御文字 (U+200B) を単語間に入れておく方法も用いられる。 なお、Unicode以前から、タイ工業規格の文字コードTIS-620が広く使われてきた。これをサポートする代表的なタイ語ワードプロセッサソフトとしてチュラーロンコーン大学で開発されたCU-Writerがあり、Microsoft Office登場以前にはもっともよく使われていたワープロソフトであった。
※この「タイ語のコンピュータ処理」の解説は、「タイ語」の解説の一部です。
「タイ語のコンピュータ処理」を含む「タイ語」の記事については、「タイ語」の概要を参照ください。
- タイ語のコンピュータ処理のページへのリンク