カローシュティー文字 (Unicodeのブロック)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/05/08 07:59 UTC 版)
カローシュティー文字 (Unicodeのブロック) | |
---|---|
Kharoshthi | |
範囲 |
U+10A00..U+10A5F (96 個の符号位置) |
面 | 追加多言語面 |
用字 | カローシュティー文字 |
主な言語・文字体系 | |
割当済 | 68 個の符号位置 |
未使用 | 28 個の保留 |
Unicodeのバージョン履歴 | |
4.1 | 65 (+65) |
11.0 | 68 (+3) |
公式ページ | |
コード表 ∣ ウェブページ |
カローシュティー文字(カローシュティーもじ、英語: Kharoshthi)は、Unicodeのブロックの一つ。
解説
アショーカ王碑文などに見られる、紀元前250年から紀元後3世紀ごろにかけて、現在のパキスタン北部とアフガニスタン東部に存在していたガンダーラ王国で話されたプラークリット(中期インド語)の一種である、インド・ヨーロッパ語族インド・イラン語派インド語群に属するガンダーラ語や、サンスクリット[1]の表記に用いられたカローシュティー文字を収録している。
ガンダーラ地域では紀元3世紀頃には使われなくなったが、紀元後3世紀から4世紀にかけては、現在の中華人民共和国の新疆ウイグル自治区にあたる中央アジアの都市ホータン及びニヤにおいて公文書や碑文にも使用され、北方シルクロード沿いのクチャとその周辺地域では7世紀まで残存していたと推測されている[1]。
カローシュティー文字は南アジアの文字としては珍しくブラーフミー文字から派生した文字体系(ブラーフミー系文字)ではなく、アラム文字に由来していると考えられている[1]。音素文字のうち子音字単独では暗黙の随伴母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類されるが、アブギダとしては珍しくアラビア文字やヘブライ文字などと同様に右から左への横書き(右横書き)である。アラビア文字のような単語内位置による字形変化は存在しない。単語ごとの分かち書きは原則しないが、現代の学術的な慣習では分かち書き・ハイフネーションが行われる[1]。子音連続など子音のみで発音する場合はU+10A3F
𐨿 KHAROSHTHI VIRAMA
(ヴィラーマ)という制御文字を用いて子音字同士の特殊な合字を形成する。
加えて、アラビア文字やタイ文字などと同様に独自の数字体系(カローシュティー数字)を有している。
カローシュティー文字にはArapacana(アラパチャナ)と呼ばれる伝統的な文字の並び順があるが、カローシュティー文字がUnicodeに追加申請された当初は文字の完全な順序の記録が発見されていなかったため、符号位置の順序は学術的慣習に基づいておおむねブラーフミー文字の順序に従っている[1]。なお、現在はArapacanaの完全な順序の記録が発見されているため、文字の正確なソート順序が判明している[2]。
Unicodeのバージョン4.1において初めて追加された。
収録文字
「ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919(及び一部はIAST)に従う。
コード | 文字 | 文字名(英語) | 用例・説明 | ラテン文字転写 |
---|---|---|---|---|
母音字 | ||||
U+10A00 | 𐨀 | KHAROSHTHI LETTER A | 短母音[a]を表す。
また、頭子音のない母音音節を表す子音字としても用いられる。 |
a |
U+10A01 | 𐨁 | KHAROSHTHI VOWEL SIGN I | 短母音[i]を表す。
子音字a, n, hでは子音字を横切る横線として、th, p, ph, m, l, śでは縦線として、それ以外の文字ではUnicode公式の例示字形のように右肩上がりの斜めの線として書かれる[1]。 |
i |
U+10A02 | 𐨂 | KHAROSHTHI VOWEL SIGN U | 短母音[u]を表す。
子音字ṭ, hでは文字から離れた下付きの丸として、mでは特殊な合字(𐨨𐨂)を形成し、それ以外の文字では文字につながる下付きの丸として書かれる[1]。 |
u |
U+10A03 | 𐨃 | KHAROSHTHI VOWEL SIGN VOCALIC R | 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。
子音字m, hでは文字から離されて書かれ、それ以外の文字では文字と重ねて書かれる[1]。 |
r̥[3] |
U+10A04 | (予約済み) | l̥[4] | ||
U+10A05 | 𐨅 | KHAROSHTHI VOWEL SIGN E | 短母音[e]を表す。
子音字a, n, hでは子音字の右側に接する横線として、th, p, ph, m, l, śでは子音字の左上に接する縦線として、子音字d, mでは特殊な合字(𐨡𐨅, 𐨨𐨅)を形成し、それ以外の文字ではUnicode公式の例示字形のように上付きの右肩上がりの短い斜め線で書かれる[1]。 |
e |
U+10A06 | 𐨆 | KHAROSHTHI VOWEL SIGN O | 短母音[o]を表す。
子音字p, ph, y, śでは文字の中央下側に接する縦線として、それ以外の文字では文字の左下に接する右肩上がりの斜め線として書かれる[1]。 |
o |
長音記号 | ||||
U+10A0C | 𐨌 | KHAROSHTHI VOWEL LENGTH MARK | 母音を長母音として発音することを表す。 | ̄ |
各種記号 | ||||
U+10A0D | 𐨍 | KHAROSHTHI SIGN DOUBLE RING BELOW | 中央アジアのいくつかの文書に見られるが、正確な発音価値はまだ確立されていない[1]。 | ͚ |
U+10A0E | 𐨎 | KHAROSHTHI SIGN ANUSVARA | アヌスヴァーラ。 | ṁ |
U+10A0F | 𐨏 | KHAROSHTHI SIGN VISARGA | ヴィサルガ。
音節末に[h]を伴うことを表す。 |
ḥ |
子音字 | ||||
U+10A10 | 𐨐 | KHAROSHTHI LETTER KA | 子音[k]を表す。 | k |
U+10A11 | 𐨑 | KHAROSHTHI LETTER KHA | 子音[kʰ]を表す。 | kh |
U+10A12 | 𐨒 | KHAROSHTHI LETTER GA | 子音[ɡ]を表す。 | g |
U+10A13 | 𐨓 | KHAROSHTHI LETTER GHA | 子音[ɡʱ]を表す。 | gh |
U+10A14 | (予約済み) | ṅ | ||
U+10A15 | 𐨕 | KHAROSHTHI LETTER CA | 子音[c]を表す。 | c |
U+10A16 | 𐨖 | KHAROSHTHI LETTER CHA | 子音[cʰ]を表す。 | ch |
U+10A17 | 𐨗 | KHAROSHTHI LETTER JA | 子音[ɟ]を表す。 | j |
U+10A18 | (予約済み) | jh | ||
U+10A19 | 𐨙 | KHAROSHTHI LETTER NYA | 子音[ɲ]を表す。 | ñ |
U+10A1A | 𐨚 | KHAROSHTHI LETTER TTA | 子音[ʈ]を表す。 | ṭ |
U+10A1B | 𐨛 | KHAROSHTHI LETTER TTHA | 子音[ʈʰ]を表す。 | ṭh |
U+10A1C | 𐨜 | KHAROSHTHI LETTER DDA | 子音[ɖ]を表す。 | ḍ |
U+10A1D | 𐨝 | KHAROSHTHI LETTER DDHA | 子音[ɖʱ]を表す。 | ḍh |
U+10A1E | 𐨞 | KHAROSHTHI LETTER NNA | 子音[ɳ]を表す。 | ṇ |
U+10A1F | 𐨟 | KHAROSHTHI LETTER TA | 子音[t]を表す。 | t |
U+10A20 | 𐨠 | KHAROSHTHI LETTER THA | 子音[tʰ]を表す。 | th |
U+10A21 | 𐨡 | KHAROSHTHI LETTER DA | 子音[d]を表す。 | d |
U+10A22 | 𐨢 | KHAROSHTHI LETTER DHA | 子音[dʱ]を表す。 | dh |
U+10A23 | 𐨣 | KHAROSHTHI LETTER NA | 子音[n]を表す。 | n |
U+10A24 | 𐨤 | KHAROSHTHI LETTER PA | 子音[p]を表す。 | p |
U+10A25 | 𐨥 | KHAROSHTHI LETTER PHA | 子音[pʰ]を表す。 | ph |
U+10A26 | 𐨦 | KHAROSHTHI LETTER BA | 子音[b]を表す。 | b |
U+10A27 | 𐨧 | KHAROSHTHI LETTER BHA | 子音[bʱ]を表す。 | bh |
U+10A28 | 𐨨 | KHAROSHTHI LETTER MA | 子音[m]を表す。 | m |
U+10A29 | 𐨩 | KHAROSHTHI LETTER YA | 子音[j]を表す。 | y |
U+10A2A | 𐨪 | KHAROSHTHI LETTER RA | 子音[r]を表す。 | r |
U+10A2B | 𐨫 | KHAROSHTHI LETTER LA | 子音[l]を表す。 | l |
U+10A2C | 𐨬 | KHAROSHTHI LETTER VA | 子音[ʋ]を表す。 | v |
U+10A2D | 𐨭 | KHAROSHTHI LETTER SHA | 子音[ɕ]を表す。 | ś |
U+10A2E | 𐨮 | KHAROSHTHI LETTER SSA | 子音[ʂ]を表す。 | ṣ |
U+10A2F | 𐨯 | KHAROSHTHI LETTER SA | 子音[s]を表す。 | s |
U+10A30 | 𐨰 | KHAROSHTHI LETTER ZA | 子音[z]を表す。 | z |
U+10A31 | 𐨱 | KHAROSHTHI LETTER HA | 子音[h]を表す。 | h |
U+10A32 | 𐨲 | KHAROSHTHI LETTER KKA | ḱ[1] | |
U+10A33 | 𐨳 | KHAROSHTHI LETTER TTTHA | ṭ́h[1] | |
U+10A34 | 𐨴 | KHAROSHTHI LETTER TTTA | ṭ́[2] | |
U+10A35 | 𐨵 | KHAROSHTHI LETTER VHA | 子音[ʋʱ]を表す。 | vh[2] |
各種記号 | ||||
U+10A38 | 𐨸 | KHAROSHTHI SIGN BAR ABOVE | 鼻音化や有気音化など、関係する子音に応じてさまざまな発音の変更を示すために使用される[1]。 | ̄ |
U+10A39 | 𐨹 | KHAROSHTHI SIGN CAUDA | 関連する子音のさまざまな変形発音、特に摩擦音化を示すために使用される[1]。 | ́ |
U+10A3A | 𐨺 | KHAROSHTHI SIGN DOT BELOW | 正確な発音価値はまだ確立されていない[1]。 | ̣ |
ヴィラーマ | ||||
U+10A3F | 𐨿 | KHAROSHTHI VIRAMA | ヴィラーマ。殺母音記号。暗黙の随伴母音/-a/を発音せず子音のみが読まれることを表す[6]。
単独のグリフ形状は任意であり、レンダー上は前の文字を次の文字と繋げた合字を形成する[1]ための不可視の制御文字である[6]。 |
|
数字 | ||||
U+10A40 | 𐩀 | KHAROSHTHI DIGIT ONE | 数字の1 | 1 |
U+10A41 | 𐩁 | KHAROSHTHI DIGIT TWO | 数字の2 | 2 |
U+10A42 | 𐩂 | KHAROSHTHI DIGIT THREE | 数字の3 | 3 |
U+10A43 | 𐩃 | KHAROSHTHI DIGIT FOUR | 数字の4 | 4 |
数値と分数 | ||||
U+10A44 | 𐩄 | KHAROSHTHI NUMBER TEN | 単位数字の10 | 10 |
U+10A45 | 𐩅 | KHAROSHTHI NUMBER TWENTY | 単位数字の20 | 20 |
U+10A46 | 𐩆 | KHAROSHTHI NUMBER ONE HUNDRED | 単位数字の100 | 100 |
U+10A47 | 𐩇 | KHAROSHTHI NUMBER ONE THOUSAND | 単位数字の1,000 | 1000 |
U+10A48 | 𐩈 | KHAROSHTHI FRACTION ONE HALF | 単位数字の1/2 | ½ |
約物 | ||||
U+10A50 | 𐩐 | KHAROSHTHI PUNCTUATION DOT | U+2022 • BULLET (ブレット)で転写される[1]。
|
• |
U+10A51 | 𐩑 | KHAROSHTHI PUNCTUATION SMALL CIRCLE | U+25E6 ◦ WHITE BULLET で転写される[1]。
|
◦ |
U+10A52 | 𐩒 | KHAROSHTHI PUNCTUATION CIRCLE | U+25CB ○ WHITE CIRCLE (白丸)で転写される[1]。
|
○ |
U+10A53 | 𐩓 | KHAROSHTHI PUNCTUATION CRESCENT BAR | U+2208 ∈ ELEMENT OF で転写される[1]。
|
∈ |
U+10A54 | 𐩔 | KHAROSHTHI PUNCTUATION MANGALAM | U+2295 ⊕ CIRCLED PLUS で転写される[1]。
|
⊕ |
U+10A55 | 𐩕 | KHAROSHTHI PUNCTUATION LOTUS | U+2742 ❂ CIRCLED OPEN CENTRE EIGHT POINTED STAR で転写される[1]。
|
❂ |
U+10A56 | 𐩖 | KHAROSHTHI PUNCTUATION DANDA | ダンダ。カローシュティー文字における句点。
韻文では半詩節の終わり(パダ)を表す。
|
| |
U+10A57 | 𐩗 | KHAROSHTHI PUNCTUATION DOUBLE DANDA | カローシュティー文字において段落の終わりを表す記号。
韻文においてスタンザ(詩節)の終わりを表す。
|
‖ |
U+10A58 | 𐩘 | KHAROSHTHI PUNCTUATION LINES | U+3030 〰 WAVY DASH (波ダッシュ)で転写される[1]。
|
〰 |
小分類
このブロックの小分類は「母音字」(Vowels)、「長音記号」(Length mark)、「各種記号」(Various signs)、「子音字」(Consonants)、「ヴィラーマ」(Virama)、「数字」(Digits)、「数値と分数」(Numbers and fractions)、「約物」(Punctuation)の8つとなっている[6]。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。
母音字(Vowels)
この小分類にはカローシュティー文字のうち、基本的な母音字が収録されている。
長音記号(Length mark)
この小分類にはカローシュティー文字のうち、母音を長母音として発音することを表す、文字幅を持たない結合記号1文字のみが収録されている。
各種記号(Various signs)
この小分類にはカローシュティー文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。
子音字(Consonants)
この小分類にはカローシュティー文字のうち、基本的な子音字が収録されている。
ヴィラーマ(Virama)
この小分類にはカローシュティー文字のうち、ヴィラーマ(殺母音記号)と呼ばれる、子音字の持つ暗黙の随伴母音/-a/を読まずに子音のみを発音することを表す記号が収録されている。
数字(Digits)
この小分類にはカローシュティー文字で用いられる固有の数字が収録されている。
アラビア・インド数字とは異なり、数字も通常の文字と同様に右横書きで書かれる。
数値と分数(Numbers and fractions)
この小分類にはカローシュティー文字のうち、位取り記法を取らない単位数字(Unicode上では10進数による位取り記法を取る"digit"とは区別され、"number"と呼ばれる)が収録されている。
約物(Punctuation)
この小分類にはカローシュティー文字で用いられる句読点などの約物類が収録されている。
文字コード
カローシュティー文字(Kharoshthi)[1] Official Unicode Consortium code chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+10A0x | 𐨀 | 𐨁 | 𐨂 | 𐨃 | 𐨅 | 𐨆 | 𐨌 | 𐨍 | 𐨎 | 𐨏 | ||||||
U+10A1x | 𐨐 | 𐨑 | 𐨒 | 𐨓 | 𐨕 | 𐨖 | 𐨗 | 𐨙 | 𐨚 | 𐨛 | 𐨜 | 𐨝 | 𐨞 | 𐨟 | ||
U+10A2x | 𐨠 | 𐨡 | 𐨢 | 𐨣 | 𐨤 | 𐨥 | 𐨦 | 𐨧 | 𐨨 | 𐨩 | 𐨪 | 𐨫 | 𐨬 | 𐨭 | 𐨮 | 𐨯 |
U+10A3x | 𐨰 | 𐨱 | 𐨲 | 𐨳 | 𐨴 | 𐨵 | 𐨸 | 𐨹 | 𐨺 | 𐨿 | ||||||
U+10A4x | 𐩀 | 𐩁 | 𐩂 | 𐩃 | 𐩄 | 𐩅 | 𐩆 | 𐩇 | 𐩈 | |||||||
U+10A5x | 𐩐 | 𐩑 | 𐩒 | 𐩓 | 𐩔 | 𐩕 | 𐩖 | 𐩗 | 𐩘 | |||||||
注釈
|
履歴
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン | コードポイント[a] | 文字数 | L2 ID | ドキュメント |
---|---|---|---|---|
4.1 | U+10A00..10A03,10A05..10A06,10A0C..10A13,10A15..10A17,
10A19..10A33,10A38..10A3A,10A3F..10A47,10A50..10A58 |
65 | L2/02-203 | Andrew Glass (10 May 2002), Proposal to Encode Kharoshthi in Plane 1 of 10646 (Revised) (英語) |
L2/02-424 | Rick McGowan (20 November 2002), Supplementary Information to Accompany L2/02-203R2, Proposal to Encode Kharoshthi (英語) | |||
11.0 | U+10A34..10A35,10A48 | 3 | L2/17-012 | Andrew Glass; Stefan Baums (17 January 2017), Additional Characters for Kharoṣṭhī Script (英語) |
|
出典
- ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae Andrew Glass (2002年5月10日). “Proposal to Encode Kharoshthi in Plane 1 of 10646 (Revised)” (英語). Unicode. 2025年5月8日閲覧。
- ^ a b c Andrew Glass, Stefan Baums (2017年1月17日). “Additional Characters for Kharoṣṭhī Script” (英語). Unicode. 2025年5月8日閲覧。
- ^ IASTではṛと表記される。
- ^ IASTではḷと表記される。
- ^ "The Unicode Standard, Version 16.0 - U0300.pdf" (PDF). The Unicode Standard (英語). 2024年11月5日閲覧。
- ^ a b c "The Unicode Standard, Version 15.1 - U10A00.pdf" (PDF). The Unicode Standard (英語). 2025年5月8日閲覧。
関連項目
- カローシュティー文字 (Unicodeのブロック)のページへのリンク