用字内の文字のカテゴリ
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/07/10 04:46 UTC 版)
「用字 (Unicode)」の記事における「用字内の文字のカテゴリ」の解説
Unicodeは、各文字に「一般カテゴリ」(general category)の属性を提供する。そのため、全ての文字には、所属する用字のほかに一般カテゴリもある。通常、用字には、大文字、小文字、修飾文字などの文字が含まれる。その中には、Dz(U+01F2)のような合成済み文字のタイトルケース(合字の1文字目を大文字にした文字)がある。そのようなタイトルケースの合字は全てラテン文字やギリシャ文字であり、互換文字であるため、Unicodeではそれらの文字の使用は推奨されていない。将来、新しいタイトルケースの文字が追加されることは考えにくい。 ほとんどの表記体系では、大文字と小文字を区別しない。そのような用字では、全ての文字が"other letter"(その他の文字)または"modifier letter"(修飾文字)として分類されている。漢字などの表意文字も"other letters"として分類される。ただし、ラテン文字、キリル文字、ギリシャ文字、アルメニア文字、グルジア文字、デザレット文字など、いくつかの用字では大文字と小文字が区別されるが、このような用字でも、大文字でも小文字でもない文字が存在する。 用字には、marks(マーク、発音区別符号など)、numbers(数字)、punctuation(句読点)、separators(スペースなどの単語区切り文字)、symbols(記号)、format(非図形形式の文字)など、その他の一般カテゴリ文字も含まれる。それらがその用字に固有である場合は、その文字は特定の用字に含まれます。 そのような文字の多くは一般的に複数の用字で統一されており、句読点ブロックや発音区別符号ブロックに含まれている。ただし、(commonやinherited以外の)用字の大部分は文字である。
※この「用字内の文字のカテゴリ」の解説は、「用字 (Unicode)」の解説の一部です。
「用字内の文字のカテゴリ」を含む「用字 (Unicode)」の記事については、「用字 (Unicode)」の概要を参照ください。
- 用字内の文字のカテゴリのページへのリンク