文字コード体系とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > 文字コード体系の意味・解説 

文字コード体系

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2018/08/04 14:31 UTC 版)

古ハングル」の記事における「文字コード体系」の解説

チョッカックッコード 「複雑なテキスト配置」も参照 初声-中声-終声文字符号化方式(첫소리-가운뎃소리-끝소리 글자부호화 방식、Syllable-Initial-Peak-Final Encoding Approachハングル符号系、または略してチョッカックッコードという、ユニコードハングル字母領域(U+1100U+11FF、U+A960〜U+A97F〔拡張A〕及びU+D7B0〜U+D7FF〔拡張B〕)のコード初声-中声(-終声)(-傍点)の順に配列した方法を指す。 チョッカックッコードを使用して訓民正音諺解本の最初の句節を表記する次のうになる。나랏〮말〯ᄊᆞ미〮 中듀ᇰ國귁에〮 달아〮 文문字ᄍᆞᆼ와〮로 서르 ᄉᆞᄆᆞᆺ디〮 아니〮ᄒᆞᆯᄊᆡ〮 従来、チョッカックッコードを使用する場合次のような問題点があった。 美しい形の古ハングル出力することができなかった。タイプライター打ったような書体でしか出力できない漢陽PUAにはある一部古ハングル字素をチョッカックッ単一コードでは入力することができず、いくつかの初・中・終声合わせて入力しなければならない上の1番を解決するためには、OpenType(TrueType Open) GSUB技術とこれに対応する字形セットフォント内蔵しなければならないマイクロソフト場合Uniscribe技術このようなフォント出力支援し、これを支援するパタン古ハングルクリム古ハングル、トドゥム古ハングル、宮書古ハングルフォント知られている。これらフォントMicrosoft Word 2002上のバージョンのオフィスプラスパックを通して配布されており、四角フォント美し古ハングル表示できる。しかし、必ずオフィスプラスパックを購入しなければフォント得られない欠点がある。 なお、Windows Vista以降追加されフォント「Malgun Gothic」は対応している2番については、やはりGSUBのligature機能使用すれば、チョッカックッの音節漢陽PUAコード対応する字形変えて表現するようにフォント次元具現することができる。またユニコード5.2以降では漢陽PUAコード領域表現するために必要な全ての字母含まれているので、それ以降漢陽PUAコードコード領域固執する理由なくなった。しかし、ユニコード領域にも含まれていない新しい字素が発見される可能性もある。事実、チョッカックッコードではこのような新し字母のために新しく文字割り当てるではなく既存コード合成して新し初声構成し入力する方式とっている。即ち、初声(L)中声(V)終声(T)各々一個ずつ調合するLVT?というような形態ではなく、L+V+T*という形態調合許容されるこのようなチョッカックッコードを支援しようとするならば、GSUBまたはこれに相応するOpenType フォント技術使用することが必須である。 漢陽使用者定義領域コード いわゆる漢陽使用者定義領域コードHanyang private use area code)または漢陽PUAコードユニコード使用者指定文字範囲使用する古ハングル口訣具現コードである。Windows XPまで韓国語Windowsシステムフォント制作してきた漢陽情報通信でこのコード対応するフォント制作した。 このコードMicrosoft Word 2000と「アレアハングル」で公式に支援されそれ以外にも政府機関などでハングル古典整理するのにも多く使用されている。しかし、漢陽使用者定義領域入っている完成形態の古ハングル音節たったの5千余個の文字にすぎないこのような原始的な限界克服するため、すでにWord最新バージョンからは漢陽PUAコード領域古ハングル支援しなくなったが、「アレアハングル2000」ではチョッカックッコード標準支援しつつも、既存の「アレアハングル文書との交換性考慮し漢陽PUAコード支援し続けている。 漢陽PUAコード使用して訓民正音諺解本の最初の句節を表記する次のうになる。나랏말미 귁에 달아 문와로 서르 디 아니 漢陽PUAコード使用するハングル文字次の通り配置されている。U+E0BC〜U+EFFF, U+F100U+F66E: 古ハングル完成型文字 U+F784〜U+F800: 古ハングル初声調合型) U+F806〜U+F864: 古ハングル中声調合型) U+F86A〜U+F8F7: 古ハングル終声調合型) それ以外文字次の通り配置されている。U+E000〜U+E0BB: 空白文字 U+F000〜U+F0FF: 特殊な絵文字フォントWingdings 1, 2, 3) U+F67E〜U+F77C: 口訣 漢陽PUAコード領域古ハングル音節にはチョッカックッコードとは異なり現代ハングル以外に字素の合成完成している形態音節含まれている。この完成型音節以外の音節U+F784〜U+F8F7領域の字素を利用して合成するようにしている。 それ以外に字素のひとつずつ(ㄱ, ㅗなど)を入力する場合可及的互換ハングル字母領域U+3130〜U+318F)の字母利用し、その領域にないものハングル字母領域U+1100U+11FF、チョッカックッコードで利用する領域)の字母そのまま利用する。ところで、ハングル字母領域文字は文字調合のため作られたものであるため、ユニコード・コンソーシアム方針従えば中声終声は文字自体空間がなく前の文字ぶら下がっているzero-width方式作られなければならない。しかし、漢陽PUAコード領域古ハングル支援する一部フォントこのような原理無視しハングル字母領域中声終声を皆文字幅に該当させている場合がある。互換ハングル字母領域ハングル字母領域にもない字母漢陽PUAにだけある字母)は漢陽PUAコード初声-中声-終声範囲利用し合成する漢陽PUAコード旧バージョンユニコード及び関連コードになかった字素を含んでいる。例えば、漢陽PUAにあるㆍ+ㅏ(漢陽PUA: )はユニコード標準にはなかったものであるユニコード5.2古ハングルの字素がさらに追加されこのような字母までユニコード書き表せようになった。しかし、漢陽PUAコードは非標準コードであり完成型形態支援する文字個数が5千余個しかない限界があり、このような漢陽PUAコード支援しない一般フォントで見ると正しく表示されない。韓国マイクロソフト支援する最新オフィスはすでに漢陽PUAコード支援せず標準的なチョッカックッコードを支援している。 こうした限界にも関わらず漢陽PUAコード領域支援している完成型形態古ハングルは相当多く使用されており、このような標準守らない多くの非標準文書量産する結果生むことになったこのような問題解決するために韓国TeX使用者フォーラムのような所では漢陽PUAコードをチョッカックッコードに変換するプロジェクト準備しその解決方法提示してもいる。

※この「文字コード体系」の解説は、「古ハングル」の解説の一部です。
「文字コード体系」を含む「古ハングル」の記事については、「古ハングル」の概要を参照ください。

ウィキペディア小見出し辞書の「文字コード体系」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「文字コード体系」の関連用語

文字コード体系のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



文字コード体系のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの古ハングル (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2024 GRAS Group, Inc.RSS