アラビア文字拡張C
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/09/15 16:37 UTC 版)
アラビア文字拡張C | |
---|---|
Arabic Extended-C | |
範囲 | U+10EC0..U+10EFF (64 個の符号位置) |
面 | 追加多言語面 |
用字 | アラビア文字 |
主な言語・文字体系 | |
割当済 | 3 個の符号位置 |
未使用 | 61 個の保留 |
Unicodeのバージョン履歴 | |
15.0 | 3 (+3) |
公式ページ | |
コード表 ∣ ウェブページ |
アラビア文字拡張C(アラビアもじかくちょうC、英語: Arabic Extended-C)は、Unicodeのブロックの一つ。
解説
アラビア文字のうち、インドネシアの言語を記述するためのペゴン文字用の文字やトルコ、リビアで用いられるイスラム教の聖典クルアーン用の記号など、アラビア文字、アラビア文字補助、アラビア文字拡張A、アラビア文字拡張Bのいずれのブロックにも含まれていないものを収録している。
通常のアラビア文字と同様に、音素文字のうち基本的に母音を表記せず、子音字のみで綴られるアブジャドに分類され、右から左への横書き(右横書き)であり、単語毎に分かち書きをする。
各文字はその単語内の位置によって独立形、語頭形、語中形、語末形の4種類の形状を取り、文字の語内位置による字形変化を説明する場合はゼロ幅接合子(U+200D; ZWJ)を用いることでその字形を表現することができる。例えば字母U+10EC2
の語中形はU+200D U+10EC2 U+200D
の形で表すことができる。
Unicodeのバージョン15.0において初めて追加された。
収録文字
コード | 文字 (独立形) |
文字名(英語) | 語頭形 | 語中形 | 語末形 | 用例・説明 |
---|---|---|---|---|---|---|
ペゴン文字用の字母 | ||||||
U+10EC2 | | ARABIC LETTER DAL WITH TWO DOTS VERTICALLY BELOW | | | | インドネシアの言語を記述するためのペゴン文字において子音[ɖ]を表す。U+068A ڊ ARABIC LETTER DAL WITH DOT BELOW 及びU+08AE ࢮ ARABIC LETTER DAL WITH THREE DOTS BELOW の異体字[1]。 |
U+10EC3 | | ARABIC LETTER TAH WITH TWO DOTS VERTICALLY BELOW | | | | ペゴン文字において子音[ʈ]を表す。U+088B ࢋ ARABIC LETTER TAH WITH DOT BELOW 及びU+088C ࢌ ARABIC LETTER TAH WITH THREE DOTS BELOW の異体字[1]。 |
U+10EC4 | | ARABIC LETTER KAF WITH TWO DOTS VERTICALLY BELOW | | | | ペゴン文字において子音[ɡ]を表す。U+088D ࢍ ARABIC LETTER KEHEH WITH TWO DOTS VERTICALLY BELOW の異体字。U+088Dとは語頭形・語中形は同じだが、独立形・語末形の形状が異なる[1]。 |
インドネシアで用いられるクルアーン用字母 | ||||||
U+10EC5 | | ARABIC SMALL YEH BARREE WITH TWO DOTS BELOW | ウスマーン写本において通常字母として書かれない[j]を表していた[2][3]。 | |||
ワルシュ式正書法で用いられるクルアーン用字母 | ||||||
U+10EC6 | | ARABIC LETTER THIN NOON | 北アフリカで広く用いられている、中世エジプトのワルシュによって発案されたワルシュ式正書法において、字母noonが連続する際に片方のnoonがこの形状で書かれる[4]。 語中形のみが存在する[2]。 |
|||
スワヒリ語用の字母 | ||||||
U+10EC7 | | ARABIC LETTER YEH WITH FOUR DOTS BELOW | | | | ザンジバル王国(現在のタンザニアに相当)の詩人・作詞家のムハマディ・キジュマ(Muhamadi Kijuma, 1855 - 1945)によって書かれた20世紀のスワヒリ語写本において、現在ラテン文字でnyと書かれる[ɲ]を表していた[5]。 |
聖書用の約物 | ||||||
U+10ED0 | | ARABIC BIBLICAL END OF VERSE | ウルドゥー語やカシミール語で書かれたキリスト教の新約聖書において節(verse)の終端を表す[2][6]。 | |||
敬称語の合字 | ||||||
U+10ED1 | | ARABIC LIGATURE ALAYHAA AS-SALAATU WAS-SALAAM | ||||
U+10ED2 | | ARABIC LIGATURE ALAYHIM AS-SALAATU WAS-SALAAM | ||||
U+10ED3 | | ARABIC LIGATURE ALAYHIMAA AS-SALAATU WAS-SALAAM | ||||
U+10ED4 | | ARABIC LIGATURE QADDASA ALLAAHU SIRRAH | ||||
U+10ED5 | | ARABIC LIGATURE QUDDISA SIRRUHUM | ||||
U+10ED6 | | ARABIC LIGATURE QUDDISA SIRRUHUMAA | ||||
U+10ED7 | | ARABIC LIGATURE QUDDISAT ASRAARUHUM | ||||
U+10ED8 | | ARABIC LIGATURE NAWWARA ALLAAHU MARQADAH | ||||
古シンド語で用いられるタンウィーン記号 | ||||||
U+10EFA | | ARABIC DOUBLE VERTICAL BAR BELOW | ||||
インドネシアで用いられるクルアーン用記号 | ||||||
U+10EFB | | ARABIC SMALL LOW NOON | インドネシアで発行されている標準ムシャフ(Mushaf Standar Indonesia; クルアーンを初めから終わりまで一冊にまとめた写本のこと)において、発音上は読まれないことを表すワスラの付いたアリフ(U+0671 ٱ ARABIC LETTER ALEF WASLA )の前に/-n/を伴う母音(タンウィーン)のうち、特に/-an/がある場合に、そのタンウィーンが読まれないことを表す[3]。 /-i/を表す母音記号のカスラが付いた |
|||
リビアで用いられるクルアーン用記号 | ||||||
U+10EFC | | ARABIC COMBINING ALEF OVERLAY | リビアのクルアーンにおいて、上付きのアリフ(ا)(U+0670 ٰ ARABIC LETTER SUPERSCRIPT ALEF )が字母ラーム(ل)に付くときの形状[7]。 |
|||
トルコで用いられるクルアーン用記号 | ||||||
U+10EFD | 𐻽 | ARABIC SMALL LOW WORD SAKTA | ||||
U+10EFE | 𐻾 | ARABIC SMALL LOW WORD QASR | ||||
U+10EFF | 𐻿 | ARABIC SMALL LOW WORD MADDA |
小分類
このブロックの小分類は「ペゴン文字用の字母」(Letters for Pegon)、「インドネシアで用いられるクルアーン用字母」(Quranic letter used in Indonesia)、「ワルシュ式正書法で用いられるクルアーン用字母」(Quranic letter used in Warsh orthography)、「スワヒリ語用の字母」(Letter used for Swahili)、「聖書用の約物」(Biblical punctuation mark)、「敬称語の合字」(Honorific word ligatures)、「古シンド語で用いられるタンウィーン記号」(Tanween mark used in Old Sindhi)、「インドネシアで用いられるクルアーン用記号」(Quranic mark used in Indonesia)、「リビアで用いられるクルアーン用記号」(Quranic mark used in Libya)、「トルコで用いられるクルアーン用記号」(Quranic marks used in Turkey)の10個となっている[8]。
ペゴン文字用の字母(Letters for Pegon)
この小分類にはアラビア文字のうち、インドネシアの言語を記述するためのペゴン文字用の字母が収録されている。
インドネシアで用いられるクルアーン用字母(Quranic letter used in Indonesia)
この小分類にはアラビア文字のうち、インドネシアにおいてイスラム教の聖典であるクルアーンの記述に用いられる字母が収録されている。
ワルシュ式正書法で用いられるクルアーン用字母(Quranic letter used in Warsh orthography)
この小分類にはアラビア文字のうち、中世エジプトのワルシュによって発案されたワルシュ式正書法によるクルアーンの表記に用いられる文字が収録されている。
スワヒリ語用の字母(Letter used for Swahili)
この小分類にはアラビア文字のうち、スワヒリ語の表記に用いられた文字が収録されている。
聖書用の約物(Biblical punctuation mark)
この小分類にはアラビア文字のうち、ウルドゥー語やカシミール語で書かれたキリスト教の新約聖書において節(verse)の終端を表す記号1つのみが収録されている。
敬称語の合字(Honorific word ligatures)
この小分類にはアラビア文字のうち、宗教的に重要な人物の名前の前などに付けられる、単語や文章をカリグラフィーのように書いた合字が収録されている。
古シンド語で用いられるタンウィーン記号(Tanween mark used in Old Sindhi)
この小分類にはアラビア文字のうち、古いシンド語でかつて用いられた、/-n/を伴う母音記号(タンウィーン)1つのみが収録されている。
インドネシアで用いられるクルアーン用記号(Quranic mark used in Indonesia)
この小分類にはアラビア文字のうち、インドネシアにおいてイスラム教の聖典であるクルアーンの記述に用いられる朗誦用の記号が収録されている。
リビアで用いられるクルアーン用記号(Quranic mark used in Libya)
この小分類にはアラビア文字のうち、リビアにおいてクルアーンの記述に用いられる朗誦用の記号が収録されている。
トルコで用いられるクルアーン用記号(Quranic marks used in Turkey)
この小分類にはアラビア文字のうち、トルコにおいてクルアーンの記述に用いられる朗誦用記号が収録されている。
文字コード
アラビア文字拡張C(Arabic Extended-C)[1] Official Unicode Consortium code chart (PDF) |
||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+10ECx | | | | | | | ||||||||||
U+10EDx | | | | | | | | | | |||||||
U+10EEx | ||||||||||||||||
U+10EFx | | | | 𐻽 | 𐻾 | 𐻿 | ||||||||||
注釈
|
履歴
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン | コードポイント[a] | 文字数 | L2 ID | ドキュメント |
---|---|---|---|---|
15.0 | U+10EFD..10EFF | 3 | L2/21-133 | Lateef Sagar Shaikh (20 July 2021), Proposal to encode Quranic marks used in Turkey (英語) |
L2/21-181 | Roozbeh Pournader (23 September 2021), Allocating Arabic Extended-C in SMP and Arabic code point changes (英語) | |||
16.0 | U+10EFC | 1 | L2/21-204 | Lateef Sagar Shaikh (24 September 2021), Proposal to encode Quranic Superscript Alef Motahafar used in Quran published in Libya (英語) |
L2/21-239 | M. van Putten (22 December 2021), Comments on L2/21-204 Quranic Superscript Alef Motahafar used in Quran published in Libya (英語) | |||
L2/22-047 | Lateef Sagar Shaikh (23 February 2022), Proposal to encode Arabic Combining Alef Overlay used in Quran published in Libya (英語) | |||
U+10EC2..10EC4 | 3 | L2/22-116 | Rikza F. Sh. (22 June 2022), Proposal to Encode Four Pegon Characters (英語) | |
17.0 | U+10EC5,10EFB | 2 | L2/22-153 | Rikza F. Sh. (18 July 2022), Proposal to Encode Three Quranic Arabic Characters (英語) |
L2/22-281 | Rikza F. Sh. (5 January 2023), Proposal to Encode Two Quranic Arabic Characters (Replaces L2/22-153) (revised) (英語) | |||
U+10ED0 | 1 | L2/23-103 | Lorna Priest Evans (10 July 2023), Proposal for ARABIC BIBLICAL END OF VERSE (英語) | |
U+10EC6 | 1 | L2/23-121 | Khaled Hosny; Mostafa Jbire (17 May 2023), Proposal to encode Arabic Letter Thin Noon (英語) | |
U+10EFA | 1 | L2/23-248 | Lateef Sagar Shaikh (19 October 2023), Proposal to encode Arabic Double Vertical Bar Below (英語) | |
U+10EC7 | 1 | L2/24-055 | Denis Moyogo Jacquerye (27 February 2024), Proposal to add Arabic letter for Swahili (英語) | |
U+10ED1..10ED8 | 8 | L2/24-077 | Roozbeh Pournader (19 March 2024), Proposal to encode twenty-five more Arabic honorifics (英語) | |
|
出典
- ^ a b c Rikza F. Sh. (2022年6月22日). “Proposal to Encode Four Pegon Characters” (英語). Unicode. 2025年5月25日閲覧。
- ^ a b c “U170-10EC0.pdf” (英語). Unicode – The World Standard for Text and Emoji. 2025年9月15日閲覧。
- ^ a b c Rikza F. Sh. (2023年1月5日). “Proposal to Encode Two Quranic Arabic Characters (Replaces L2/22-153) (revised)” (英語). Unicode. 2025年9月15日閲覧。
- ^ Khaled Hosny, Mostafa Jbire (2023年5月17日). “Proposal to encode Arabic Letter Thin Noon” (英語). Unicode. 2025年9月16日閲覧。
- ^ Denis Moyogo Jacquerye (2024年2月27日). “Proposal to add Arabic letter for Swahili” (英語). Unicode. 2025年9月15日閲覧。
- ^ Lorna Priest Evans (2023年7月10日). “Proposal for ARABIC BIBLICAL END OF VERSE” (英語). Unicode. 2025年9月15日閲覧。
- ^ Lateef Sagar Shaikh (2021年9月24日). “Proposal to encode Quranic Superscript Alef Motahafar used in Quran published in Libya” (英語). Unicode. 2025年5月25日閲覧。
- ^ “The Unicode Standard, Version 15.1 - U10EC0.pdf” (PDF). The Unicode Standard (英語). 2025年5月25日閲覧.
関連項目
- アラビア文字拡張Cのページへのリンク