文字の使用頻度とは？わかりやすく解説

文字の出現頻度（もじのしゅつげんひんど、英: Letter frequency）とは、書記言語においてアルファベット（ひらがな、漢字）などの文字が出現する回数の平均をまとめたものを指す。文字の頻度分析はアラブ人数学者のアル＝キンディー（801–873）が暗号解読を行うために確立したことから始まる^[1]。またヨーロッパにおいては文字の頻度分析は1450年に活字が発明され、活字に必要な各字形の量を推定するために重要性を増した^[2]。一方言語学者の間では未知の表記体系に対する言語同定の技法として文字の頻度分析を行っている^[3]。

文字の出現頻度や頻度分析は暗号文やハングマン、スクラブル、Wordleのような単語パズルゲームにおいて利用されており^[4]、米国のテレビ番組『ホイール・オブ・フォーチュン』においても利用されている^[5]。エドガー・アラン・ポーの小説『黄金虫』では英文字の出現頻度の知見を活かして暗号文の解読を行った記述がある古い文献の一つであり^[6]、キャプテン・キッド秘蔵の財宝のありかを示すメッセージを頻度分析により解読している^[7]。

ハーバード・ジムは暗号学入門著書『Codes and Secret Writing』において英語の出現頻度は "ETAON RISHD LFCMU GYPWB VKJXZQ" の順序で出現頻度が高いとし、2文字（連接文字）に関しては "TH HE AN RE ER IN ON AT ND ST ES EN OF TE ED OR TI HI AS TO"、同じ文字が連続して出現する順序は "LL EE SS OO TT FF RR NN PP CC" である^[8]。なお、出現頻度の加算方法の違いによって数値は多少変動する場合がある。

文字の出現頻度は一部のキーボード配列のデザインにも影響を与えている^[9]。ブリッケンデルファー型タイプライターやDvorak配列、Colemak配列などは出現頻度の高い文字をホームポジションに配置している^[10]。

背景

カリフォルニア・ジョブ・ケースは19世紀に発明された印刷時に必要となる活字を収納するケースであり、文字の普遍性に応じて各文字のスペースが区切られている^[11]。

文書中における文字の出現頻度は暗号解読において研究され、特にアラブ人数学者のアル＝キンディー（801–873）が頻度分析の手法を確立したことで広まったとされる（頻度分析を用いて解読できる暗号は頻度分析の前から存在するガイウス・ユリウス・カエサルが発明したシーザー暗号が挙げられ^[12]、頻度分析自体はより以前から研究されていた可能性がある。）^[1]。1450年にはヨーロッパにおいて活版印刷が発明され、活字ケースの区画スペースの大きさがそれぞれ違うことからも読み取れるように、活版印刷に必要な各文字の字形の量を推定する必要が生じたことで文字の出現頻度分析の重要性が増した^[2]。

すべての言語において厳密な文字の出現頻度の分布は文字の書き手によって使用する文法や単語が異なるため、求めることが不可能である^[13]。しかしながら、ほとんどの言語において一定量の文書内での文字の出現頻度は特有の分布が現れる。例として、（互いに理解することが困難とされ、）極端な言語の変遷を経た古英語と現代英語それぞれの文字の出現頻度においても類似した特徴を持つことがある^[14]。聖書のある一節における両者の文字の出現頻度は高い順に、古英語: enaid sorhm tgþlwu æcfy ðbpxz、現代英語: eotha sinrd luymw fgcbp kvjqxz となり^[15]、違いとしては第一にそれぞれでのみ使用されている文字が存在することが挙げられるが、両者とも ⟨e⟩ が最も出現頻度の高い文字である^[16]。

英語圏でのライノタイプを使用していた職人の長年の経験と習慣から文字の出現頻度の高い順から低い順に etaoin shrdlu cmfwyp vbgkqj xz であると考えられており^[17]、フランス語圏においては elaoin sdrétu cmfhyp vbgwqj xz の出現頻度であると考えられていた^[18]。

モールス符号。Eを短点一つ、Aを長点一つ...と文字の出現頻度が高い順に短い符号が割り当てられている^[19]。

各アルファベットのモールス符号を通信にかかる時間が短いまとまり順に並べると e it san hurdm wgvlfbk opxcz jyq となる^{[注釈 1]}。文字の出現頻度はMurray Codeのような他の電信システムにおいても考慮されている^[21]。

文字の出現頻度における同様の利用例としてはハフマン符号のような現代のデータ圧縮などが挙げられる^[22]。

文字の出現頻度は単語の出現頻度（英語版）と同様に書き手や記述されている内容によって異なった出現頻度となる^[23]。フィクション小説を例としてみると、文章の時制が過去形で書かれることが多くなることから^[24]、⟨d⟩ の出現頻度が高くなるとされている。またX線に関するエッセイの文字の出現頻度は ⟨x⟩ が異様に高くなることが考えられる^[13]。加えて、執筆者の言葉の言い回しからも文字の出現頻度は影響を受けるとされる^[25]。例として、芥川龍之介の文体と菊池寛の文体は文字の頻度分析によって明確に区別することが可能であると検証されている^[26]。単文字、バイグラム、トライグラム、単語の出現頻度、単語の長さ、文章の長さを求めることで文章の表現方法が類似している著者の作品に対して、識別することが可能となる^[27]^[13]。

より厳密な文字の出現頻度は大規模な文書データを分析することで求めることができる。大規模な文書データに対する分析は現代のコンピュータと大規模なテキストコーパスを使用することで容易に行うことができる。より具体的には（出版記事、宗教文書、学術文書、フィクション小説など）さまざまな資料をもとに出現頻度を求めることができる^[28]。

また同じ言語を使用する地域ごとにも文字の出現頻度はそれぞれ違いがある。例として、米国では "analyze"、"apologize"、"recognize" のように ⟨z⟩ が含まれた単語を用いているが、英国においてはこれらの単語がそれぞれ "analyse"、"apologise"、"recognise" のように異なった綴りで書かれている^[29]。このことから米国における ⟨z⟩ の出現頻度は英国とは異なった出現頻度とされる^[30]。

アルファベットにおいて出現頻度の高い上位十二文字の割合は約 80% にも達する^[31]。また上位八文字のみについても出現頻度は 65% に達する。文字の出現頻度はいくつかのランク関数によく適合し、中でも2つパラメータを持つベータランク関数が最も適合する^[32]。パラメータを持たないランク関数も文字の出現頻度の分布に適合される（これらのランク関数はタンパク質構造におけるアミノ塩基の出現頻度を表す際にも使用されている^[33]）^[34]。VIC暗号（英語版）やストラドリング・チェッカーボード（英語版）に基づいた暗号を使用するスパイは通常 "a sin to err"（2つ目の "r" を省略）^[35]^[36] や "at one sir"^[37] といった語呂合わせを用いて出現頻度の高い八文字を記憶する。

日本語における文字の出現頻度

平仮名

平仮名の出現頻度は以下の表の通りである^[38]^[39]。分析に使用したデータにおける平仮名の総数は 20,711,361文字である^[38]。

順位	平仮名	度数	割合
1	の	1,918,313	9.262%	9.262
2	に	1,108,840	5.354%	5.354
3	た	1,067,566	5.155%	5.155
4	い	1,060,284	5.119%	5.119
5	は	937,811	4.528%	4.528
6	を	936,356	4.521%	4.521
7	と	927,938	4.480%	4.48
8	る	916,652	4.425%	4.425
9	が	860,742	4.156%	4.156
10	し	848,132	4.095%	4.095
11	で	764,834	3.693%	3.693
12	て	758,316	3.661%	3.661
13	な	720,156	3.477%	3.477
14	か	537,294	2.594%	2.594
15	っ	467,350	2.257%	2.257
16	れ	450,805	2.177%	2.177
17	ら	423,294	2.044%	2.044
18	も	396,142	1.913%	1.913
19	う	352,965	1.704%	1.704
20	す	340,654	1.645%	1.645
21	り	333,999	1.613%	1.613
22	こ	312,227	1.508%	1.508
23	だ	280,911	1.356%	1.356
24	ま	278,599	1.345%	1.345
25	さ	258,960	1.250%	1.25
26	き	233,505	1.127%	1.127
27	め	223,806	1.081%	1.081
28	く	221,960	1.072%	1.072
29	あ	204,256	0.986%	0.986
30	け	199,362	0.963%	0.963
31	ど	196,555	0.949%	0.949
32	ん	190,068	0.918%	0.918
33	え	163,664	0.790%	0.79
34	よ	154,206	0.745%	0.745
35	つ	153,999	0.744%	0.744
36	や	146,156	0.706%	0.706
37	そ	131,611	0.635%	0.635
38	わ	123,077	0.594%	0.594
39	ち	99,183	0.479%	0.479
40	み	89,264	0.431%	0.431
41	せ	83,444	0.403%	0.403
42	ろ	73,467	0.355%	0.355
43	ば	72,228	0.349%	0.349
44	お	65,870	0.318%	0.318
45	じ	56,857	0.275%	0.275
46	べ	56,005	0.270%	0.27
47	ず	53,256	0.257%	0.257
48	げ	49,126	0.237%	0.237
49	ほ	48,752	0.235%	0.235
50	へ	47,013	0.227%	0.227
51	び	32,312	0.156%	0.156
52	む	31,212	0.151%	0.151
53	ご	26,965	0.130%	0.13
54	ね	23,490	0.113%	0.113
55	ぶ	23,280	0.112%	0.112
56	ぐ	21,549	0.104%	0.104
57	ぎ	19,865	0.096%	0.096
58	ひ	19,148	0.092%	0.092
59	ょ	14,425	0.070%	0.07
60	づ	13,125	0.063%	0.063
61	ぼ	12,402	0.060%	0.06
62	ざ	12,108	0.058%	0.058
63	ふ	11,606	0.056%	0.056
64	ゃ	11,522	0.056%	0.056
65	ぞ	10,047	0.049%	0.049
66	ゆ	8,486	0.041%	0.041
67	ぜ	6,893	0.033%	0.033
68	ぬ	5,124	0.025%	0.025
69	ぱ	4,349	0.021%	0.021
70	ゅ	2,755	0.013%	0.013
71	ぴ	1,608	0.008%	0.008
72	ぽ	1,315	0.006%	0.006
73	ぷ	986	0.005%	0.005
74	ぺ	477	0.002%	0.002
75	ぁ	125	0.001%	0.001
76	ぇ	106	0.001%	0.001
77	ぢ	82	0.000%
78	ゑ	75	0.000%
79	ゐ	48	0.000%
80	ぉ	21	0.000%
81	ぃ	21	0.000%
82	ゎ	3	0.000%
83	ぅ	1	0.000%

片仮名

片仮名の出現頻度は以下の表の通りである^[40]^[39]。分析に使用したデータにおける片仮名の総数は 3,608,288文字である^[40]。

順位	片仮名	度数	割合
1	ン	290,948	8.063%	8.063
2	ル	189,442	5.250%	5.25
3	ス	178,214	4.939%	4.939
4	ト	162,802	4.512%	4.512
5	ア	127,845	3.543%	3.543
6	イ	120,807	3.348%	3.348
7	ラ	117,203	3.248%	3.248
8	リ	106,744	2.958%	2.958
9	ク	98,209	2.722%	2.722
10	ッ	86,894	2.408%	2.408
11	カ	82,982	2.300%	2.3
12	シ	80,626	2.235%	2.235
13	タ	75,319	2.087%	2.087
14	ロ	75,301	2.087%	2.087
15	ド	74,257	2.058%	2.058
16	ジ	61,171	1.695%	1.695
17	フ	61,115	1.694%	1.694
18	レ	60,608	1.680%	1.68
19	メ	60,230	1.669%	1.669
20	コ	58,724	1.628%	1.628
21	マ	56,123	1.555%	1.555
22	プ	54,159	1.501%	1.501
23	テ	53,404	1.480%	1.48
24	ム	50,758	1.407%	1.407
25	チ	48,437	1.342%	1.342
26	バ	44,970	1.246%	1.246
27	ビ	44,462	1.232%	1.232
28	グ	40,433	1.121%	1.121
29	キ	39,608	1.098%	1.098
30	ウ	39,323	1.090%	1.09
31	サ	39,202	1.086%	1.086
32	ニ	38,711	1.073%	1.073
33	ナ	38,047	1.054%	1.054
34	エ	36,458	1.010%	1.01
35	ブ	35,920	0.995%	0.995
36	パ	35,416	0.982%	0.982
37	セ	34,883	0.967%	0.967
38	オ	34,718	0.962%	0.962
39	ィ	33,747	0.935%	0.935
40	デ	32,665	0.905%	0.905
41	ュ	32,616	0.904%	0.904
42	ミ	29,262	0.811%	0.811
43	ャ	28,144	0.780%	0.78
44	ボ	26,651	0.739%	0.739
45	ダ	26,396	0.732%	0.732
46	ツ	24,541	0.680%	0.68
47	ポ	23,742	0.658%	0.658
48	ベ	22,755	0.631%	0.631
49	ネ	22,462	0.623%	0.623
50	ガ	22,061	0.611%	0.611
51	ハ	21,839	0.605%	0.605
52	ワ	21,784	0.604%	0.604
53	ソ	20,784	0.576%	0.576
54	ケ	20,633	0.572%	0.572
55	モ	20,070	0.556%	0.556
56	ノ	19,572	0.542%	0.542
57	ズ	19,240	0.533%	0.533
58	ピ	18,692	0.518%	0.518
59	ホ	18,204	0.505%	0.505
60	ェ	17,817	0.494%	0.494
61	ョ	17,731	0.491%	0.491
62	ペ	14,881	0.412%	0.412
63	ゴ	13,931	0.386%	0.386
64	ヤ	12,526	0.347%	0.347
65	ギ	10,732	0.297%	0.297
66	ヨ	10,318	0.286%	0.286
67	ザ	10,144	0.281%	0.281
68	ァ	10,121	0.280%	0.28
69	ゼ	7,689	0.213%	0.213
70	ヒ	7,289	0.202%	0.202
71	ヘ	7,129	0.198%	0.198
72	ユ	6,653	0.184%	0.184
73	ゲ	6,481	0.180%	0.18
74	ォ	6,245	0.173%	0.173
75	ヌ	2,897	0.080%	0.08
76	ゾ	2,640	0.073%	0.073
77	ヴ	1,145	0.032%	0.032
78	ゥ	1,050	0.029%	0.029
79	ヂ	149	0.004%	0.004
80	ヅ	127	0.004%	0.004
81	ヲ	122	0.003%	0.003
82	ヱ	73	0.002%	0.002
83	ヰ	40	0.001%	0.001
84	ヵ	14	0.000%
85	ヮ	9	0.000%
86	ヶ	2	0.000%

漢字

文化庁によりまとめられた日本語における漢字の出現頻度上位50文字は以下の表の通りである^[41]。分析に使用されたデータは総数177,276,398文字であり、そのうち漢字は51,258,216文字であった^[42]。出現頻度の高い上位100文字はすべて常用漢字である^[43]。

順位	漢字	割合
1	人	1.156%
2	一	0.996%
3	大	0.737%
4	日	0.709%
5	年	0.668%
6	出	0.629%
7	言	0.614%
8	本	0.612%
9	生	0.605%
10	分	0.594%

順位	漢字	割合
11	見	0.586%
12	者	0.539%
13	上	0.536%
14	中	0.535%
15	自	0.532%
16	事	0.522%
17	思	0.496%
18	行	0.493%
19	時	0.482%
20	手	0.478%

順位	漢字	割合
21	間	0.475%
22	子	0.467%
23	二	0.461%
24	的	0.445%
25	気	0.432%
26	合	0.426%
27	前	0.407%
28	国	0.389%
29	会	0.381%
30	方	0.379%

順位	漢字	割合
31	場	0.372%
32	学	0.371%
33	第	0.366%
34	物	0.357%
35	作	0.355%
36	入	0.348%
37	定	0.347%
38	私	0.341%
39	後	0.333%
40	三	0.332%

順位	漢字	割合
41	目	0.331%
42	家	0.322%
43	地	0.319%
44	法	0.314%
45	業	0.312%
46	十	0.308%
47	性	0.304%
48	当	0.304%
49	部	0.300%
50	体	0.297%

順位	漢字	割合
51	立	0.295%
52	用	0.292%
53	理	0.291%
54	動	0.291%
55	書	0.287%
56	下	0.282%
57	実	0.281%
58	同	0.277%
59	話	0.273%
60	小	0.273%

順位	漢字	割合
61	女	0.273%
62	何	0.268%
63	代	0.268%
64	月	0.266%
65	意	0.265%
66	長	0.261%
67	感	0.258%
68	文	0.249%
69	今	0.247%
70	取	0.247%

順位	漢字	割合
71	力	0.244%
72	関	0.244%
73	対	0.243%
74	発	0.241%
75	知	0.237%
76	高	0.236%
77	度	0.232%
78	社	0.228%
79	心	0.225%
80	田	0.225%

順位	漢字	割合
81	内	0.222%
82	全	0.221%
83	新	0.221%
84	来	0.218%
85	通	0.217%
86	所	0.114%
87	化	0.213%
88	持	0.213%
89	現	0.213%
90	最	0.210%

順位	漢字	割合
91	考	0.210%
92	世	0.210%
93	以	0.209%
94	名	0.208%
95	彼	0.206%
96	明	0.205%
97	主	0.203%
98	不	0.202%
99	条	0.202%
100	外	0.200%

1993年の調査では、日本において使用される字体の異なる漢字の総数（異なり字）は計4476文字であり、出現頻度の高い漢字の上位500文字で出現頻度は約8割に達する^[44]。また、出現頻度の高い漢字上位1600文字での出現頻度は約99%を占め、残りの約3000文字においては全体の1%程度の出現頻度となっている^[44]。

文字種別の出現頻度

日本語における記号、数字、平仮名、片仮名、漢字、アルファベットの文字の種類別の出現頻度は以下の通りとなる。

調査年	文字種別出現頻度						詳細	出典
調査年	平仮名	片仮名	漢字	アルファベット	記号	数字	詳細	出典
1964年	56.0%	6.3%	35.9%	0.2%	1.6%		1964年当時の雑誌九十種に対する調査。総数83,923文字。	^[45]
1981年	40.2%	4.9%	40.7%	2.0%	8.3%	3.9%	1981年当時のRICOHが保有する事務文書に対する調査。総数76,100文字。	^[46]
1994年	35.7%	16.0%	26.9%	3.9%	17.6%		1994年当時の雑誌七十種に対する調査。総数2,116,736文字。	^[45]
2000年	34.06%	6.34%	41.46%	0.46%	15.58%	2.10%	1993年の新聞記事に対する調査。総数5,500万文字。	^[47]

英語における文字の出現頻度

文字	英語における相対出現頻度^[48]^[49]
A	8.2%	8.2
B	1.5%	1.5
C	2.8%	2.8
D	4.3%	4.3
E	12.7%	12.7
F	2.2%	2.2
G	2.0%	2
H	6.1%	6.1
I	7.0%	7
J	0.15%	0.15
K	0.77%	0.77
L	4.0%	4
M	2.4%	2.4
N	6.7%	6.7
O	7.5%	7.5
P	1.9%	1.9
Q	0.095%	0.095
R	6.0%	6
S	6.3%	6.3
T	9.1%	9.1
U	2.8%	2.8
V	0.98%	0.98
W	2.4%	2.4
X	0.15%	0.15
Y	2.0%	2
Z	0.074%	0.074

文字の相対出現頻度

英話者が長期間使用したキーボード。E、O、T、H、A、S、I、N、R のキーには激しい摩耗が見られ、D、L、U、Y、M、W、F、G、C、B、P のキーにはある程度の摩耗が見られ、K、V、J、Q、X、Z のキーには摩耗がほとんど見られない。

文字の出現頻度を算出する方法は大きく三種類存在し、各方法によって文字の出現頻度の分布は大きく異なってくる。一つ目は辞書の見出し語として書かれている基本語（英語版）ごとに文字の出現頻度を加算する方法である^[50]。以下の節ではこの方法により文字の出現頻度を求めている。二つ目は基本語の "abstract" を "abstracts"、"abstracted"、"abstracting" のように語形変化の単語ごとに文字の出現頻度を加算する方法である。この方法では、インターネット上で頻出する英単語のリストから文字の出現頻度を求める場合に、⟨s⟩ のような文字の出現頻度がより現れるとされる。すなわち、⟨s⟩ は複数形や三人称単数現在形の動詞中に付け加えられる文字であるため、非基本語の単語中に普遍的に現れる文字となっている。三つ目は実際の文書中に使用されている単語そのままを文字の出現頻度として加算する方法であり、これにより "the"、"then"、"both"、"this" のような単語の頻出により ⟨th⟩ の出現頻度がより現れるとされる。そして、絶対的な文字の出現頻度が求められるこの方法ではキーボードのレイアウトや古来の印刷機における文字の頻出度合いについて求めることができる。

英英辞典『Concise Oxford dictionary』を辞典内における単語の頻出度合を無視して文字の出現頻度を分析すると、順番は "EARIOTNSLCUDPMHGBFYWKVXZJQ" であった^[50]。

この出現頻度順はロベルト・ルワンド著『Cryptological Mathematics』を引用したパベル・ミツカ氏のウェブサイトにまとめられていたものである^[51]。

ルワンドによると、文字の出現頻度の高い順から並べると、etaoinshrdlcumwfgypbvkjxqz となることが言及されている。このルワンドの出現頻度順はコーネル大学の「Math Explorer's Project」による40000文字に対する文字の出現頻度順とは異なった並びとなっている^[52]。

英語における空白記号の出現頻度は英文字の出現頻度が最も高い ⟨e⟩ の約2倍となっており^[53]、非アルファベット文字（数字、句読点など）総計の出現頻度は ⟨t⟩ と ⟨a⟩ の間となる4番目（空白記号も含めた順位）に位置している^[54]。

単語の頭文字・末尾の文字の相対出現頻度

相対出現頻度^[55]

文字	英単語の頭文字
A	11.7%
B	4.6%
C	4.8%
D	2.5%
E	2.9%
F	4.1%
G	1.7%
H	5.4%
I	5.8%
J	0.54%
K	0.49%
L	2.4%
M	3.9%
N	2.2%
O	7.3%
P	3.9%
Q	0.19%
R	2.6%
S	6.9%
T	16.2%
U	1.2%
V	0.65%
W	6.1%
X	0.002%
Y	0.82%
Z	0.021%

文字	英単語の末尾の文字
A	2.9%
B	0.1%
C	0.51%
D	10.6%
E	20.4%
F	4.3%
G	3.1%
H	2.6%
I	0.6%
J	0.01%
K	0.92%
L	3.2%
M	1.7%
N	8.9%
O	4.3%
P	0.6%
Q	0.001%
R	6%
S	12.5%
T	9.3%
U	0.4%
V	0.03%
W	0.9%
X	0.127%
Y	5.96%
Z	0.029%

単語の頭文字の出現頻度を分析することは物理的空間におけるファイルや索引の量を割り当てるために重要視されている^[56]。アルファベット 26 文字に対応したファイリングキャビネット（英語版）の引き出しを準備する場合に、各文字ごとに一つの引き出し、つまり 1:1 の割当を行うのではなく、頭文字の出現頻度に沿った引き出しの割当を行うことが合理的であると考えられる。すなわち、出現頻度の低い VWXYZ をまとめて一つの引き出しに割り当てる、出現頻度の高い ⟨s, a, c⟩ では Aa-An、Ao-Az、Ca-Cj、Ck-Cz、Sa-Si、Sj-Sz のように複数の引き出しを割り当てることが考えられる。同様の事例としては複数の巻に分かれた百科事典の構成や図書館において書籍の識別の名前の頭文字の分布を均等にするための Cutter number が挙げられる^[57]。

英単語全体および頭文字の出現頻度の分布は両者ともにジップ分布に従い、またユール分布（英語版）にも十分従うことが知られている^[58]。

一般的に数字の最初の桁の出現頻度の分布は数字全体の分布と比べて有意に差があるとされており、これはベンフォードの法則として知られている（ベンフォードの法則節を参照）^[59]。

ピーター・ノーヴィグは光学文字認識（OCR）を用いてGoogle Booksのデータにおける100,000単語以上出現する単語を対象にした英単語の頭文字の出現頻度が分析された^[60]。

ラテン文字を使用する言語における文字の相対出現頻度

文字	英語^[61]	フランス語^[62]	ドイツ語^[63]	スペイン語^[64]	ポルトガル語^[65]	イタリア語^[66]	トルコ語^[67]	スウェーデン語^[68]	ポーランド語^[69]	オランダ語^[70]	デンマーク語^[71]	アイスランド語^[72]	フィンランド語^[73]	チェコ語^[74]	ハンガリー語^[75]	ウェールズ語^[76]	リトアニア語^[77]	スロベニア語^[78]	エスペラント語^[79]	ルーマニア語^[80]	マレー語^[81]	インドネシア語^[81]
a	8.672%	7.636%	6.516%	11.525%	14.634%	11.745%	11.920%	9.383%	8.965%	7.49%	6.025%	10.110%	12.217%	6.219%	8.89%	10.241%	11.191%	10.466%	11.71%	9.95%	19.9%	20.39%
b	1.485%	0.901%	1.886%	2.215%	1.043%	0.927%	2.844%	1.535%	1.482%	1.58%	2.000%	1.043%	0.281%	1.558%	1.94%	1.867%	1.484%	1.939%	1.08%	1.07%	3.2%	2.64%
c	3.424%	3.260%	2.732%	4.019%	3.882%	4.501%	0.963%	1.486%	3.988%	1.24%	0.565%	~0%	0.281%	1.607%	0.646%	1.776%	0.602%	0.662%	0.86%	5.28%	0.3%	0.76%
d	3.904%	3.669%	5.076%	5.010%	4.992%	3.736%	4.706%	4.702%	3.293%	5.93%	5.858%	1.575%	1.043%	3.602%	1.92%	5.136%	2.580%	3.390%	2.93%	3.45%	2.9%	5.00%
e	12.155%	14.715%	16.396%	13.702%	13.101%	11.792%	8.912%	10.149%	7.921%	18.91%	15.453%	6.418%	7.968%	7.695%	11.6%	8.116%	5.621%	10.707%	9.26%	11.47%	8.7%	8.28%
f	2.302%	1.066%	1.656%	0.692%	1.023%	1.153%	0.461%	2.027%	0.312%	0.81%	2.406%	3.013%	0.194%	0.273%	0.548%	2.675%	0.347%	0.110%	1.01%	1.18%	0.0%	0.21%
g	1.945%	0.866%	3.009%	1.768%	1.303%	1.644%	1.253%	2.862%	1.377%	3.40%	4.077%	4.241%	0.392%	0.273%	3.79%	3.412%	1.795%	1.638%	1.16%	0.99%	1.6%	3.66%
h	4.745%	0.937%	4.577%	1.973%	1.281%	0.136%	1.212%	2.090%	1.072%	2.38%	1.621%	1.871%	1.851%	1.271%	1.26%	1.479%	0.276%	1.047%	0.35%	0.47%	2.6%	2.74%
i	7.532%	7.529%	6.550%	6.247%	6.186%	10.143%	8.600%*	5.817%	8.286%	6.50%	6.000%	7.578%	10.817%	4.353%	4.25%	7.569%	12.959%	9.042%	10.40%	9.96%	8.0%	7.98%
j	0.187%	0.813%	0.268%	0.493%	0.379%	0.011%	0.034%	0.614%	2.343%	1.46%	0.730%	1.144%	2.042%	2.119%	1.48%	0.078%	2.338%	4.675%	3.40%	0.24%	1.9%	0.87%
k	0.600%	0.074%	1.417%	0.026%	0.015%	0.009%	4.683%	3.140%	3.411%	2.25%	3.395%	3.314%	4.973%	3.737%	4.85%	0.040%	4.171%	3.704%	4.22%	0.11%	5.8%	5.14%
l	4.237%	5.456%	3.437%	4.967%	2.779%	6.510%	5.922%	5.275%	2.136%	3.57%	5.229%	4.532%	5.761%	3.842%	6.71%	3.358%	3.502%	5.266%	5.73%	4.48%	3.8%	3.26%
m	2.647%	2.968%	2.534%	3.157%	4.738%	2.512%	3.752%	3.471%	2.911%	2.21%	3.237%	4.041%	3.202%	3.227%	3.82%	2.593%	3.579%	3.305%	3.29%	3.10%	3.5%	4.21%
n	7.337%	7.095%	9.776%	6.712%	4.446%	6.883%	7.487%	8.542%	5.600%	10.03%	7.240%	7.711%	8.826%	6.535%	6.82%	8.552%	5.144%	6.328%	8.04%	6.47%	9.3%	9.33%
o	7.377%	5.796%	2.594%	8.683%	9.735%	9.832%	2.476%	4.482%	7.590%	6.06%	4.636%	2.166%	5.614%	8.666%	3.65%	6.280%	6.743%	9.084%	8.44%	4.07%	1.3%	1.26%
p	2.124%	2.521%	0.670%	2.510%	2.523%	3.056%	0.886%	1.839%	3.101%	1.57%	1.756%	0.789%	1.842%	3.413%	0.48%	0.819%	2.734%	3.374%	2.60%	3.18%	4.5%	2.61%
q	0.110%	1.362%	0.018%	0.877%	1.204%	0.505%	0	0.020%	0.003%	0.009%	0.007%	0	0.013%	0.001%	~0%	0.004%	0.005%	0	5.63%	0.00%	0.0%	0.01%
r	6.625%	6.693%	7.003%	6.871%	6.530%	6.367%	6.722%	8.431%	4.571%	6.41%	8.956%	8.581%	2.872%	3.697%	2.65%	7.085%	5.669%	5.010%	0	6.82%	8.3%	4.64%
s	6.633%	7.948%	7.270%	7.977%	6.805%	4.981%	3.014%	6.590%	4.263%	3.73%	5.805%	5.630%	7.862%	4.516%	6.99%	2.854%	7.881%	5.053%	6.25%	4.40%	3.8%	4.15%
t	8.598%	7.244%	6.154%	4.632%	4.336%	5.623%	3.314%	7.691%	3.966%	6.79%	6.862%	4.953%	8.750%	5.727%	6.96%	1.842%	5.332%	4.329%	5.51%	6.04%	3.2%	5.58%
u	2.691%	6.311%	4.166%	3.927%	3.639%	2.813%	3.235%	1.919%	2.347%	1.99%	1.979%	4.562%	5.008%	3.144%	0.392%	2.723%	4.586%	1.879%	3.19%	6.20%	4.5%	4.62%
v	1.061%	1.838%	0.846%	1.138%	1.575%	2.097%	0.959%	2.415%	0.034%	2.85%	2.332%	2.437%	2.250%	4.662%	2.31%	0.052%	2.656%	3.764%	1.86%	1.23%	0.3%	0.18%
w	1.673%	0.049%	1.921%	0.027%	0.037%	0.033%	0	0.142%	4.549%	1.52%	0.069%	0	0.094%	0.009%	~0%	4.642%	0.037%	0	0	0.03%	0.3%	0.48%
x	0.202%	0.427%	0.034%	0.515%	0.453%	0.008%	0	0.159%	0.019%	0.036%	0.028%	0.046%	0.031%	0.076%	~0%	0.040%	0.073%	0	0	0.11%	0.0%	0.03%
y	1.551%	0.708%	0.039%	1.433%	0.006%	0.020%	3.336%	0.708%	3.857%	0.035%	0.698%	0.900%	1.745%	1.909%	2.56%	8.971%	1.433%	0	0	0.07%	1.9%	1.88%
z	0.132%	0.326%	1.134%	0.467%	0.470%	1.181%	1.500%	0.070%	5.620%	1.39%	0.034%	0	0.051%	2.199%	4.3%	0.009%	0.345%	2.103%	0.48%	0.71%	0.3%	0.04%
à	0.0005%	0.486%	0	~0%	0.072%	0.635%	0	0	0	0	0	0	0	0	0	0.000%	0.0003%	0	0	0	0	0
â	0.0006%	0.051%	0	0	0.562%	~0%	~0%	0	0	0	0	0	0	0	0	0.147%	0.0002%	0	0	0.91%	0	0
á	0.005%	0	0	0.502%	0.118%	0	0	0	0	0	0	1.799%	0	2.236%	3.44%	0.0002%	0.002%	0	0	0	0	0
å	0.0007%	0	0	0	0	0	0	1.34%	0	0	1.190%	~0%	0.003%	0	0	0	0.0002%	0	0	0	0	0
ä	0.002%	0	0.578%	0	0	0	0	1.80%	0	0	0	0	3.577%	0	0	0.001%	0.001%	0	0	0	0	0
ã	0.0005%	0	0	0	0.733%	0	0	0	0	0	0	0	0	0	0	0	0.0003%	0	0	0	0	0
ą	0.00009%	0	0	0	0	0	0	0	1.021%	0	0	0	0	0	0	0	0.542%	0	0	0	0	0
ā	0.002%	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.001%	0	0	0	0	0
ă	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.0002%	0	0	4.06%	0	0
æ	0.0008%	0	0	0	0	0	0	0	0	0	0.872%	0.867%	0	0	0	0	0.0002%	0	0	0	0	0
œ	0.00008%	0.018%	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0
ç	0.001%	0.085%	0	~0%	0.530%	0	1.156%	0	0	0	0	~0%	0	0	0	0	0.0004%	0	0	0	0	0
ć	0.0006%	0	0	0	0	0	0	0	0.448%	0	0	0	0	0	0	0	0.0003%	0	0	0	0	0
ĉ	0%	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.80%	0	0	0
č	0.0005%	0	0	0	0	0	0	0	0	0	0	0	0	0.949%	0	0	0.430%	1.483%	0	0	0	0
ch	0	0	0	0	0	0	0	0	0	0	0	0	0	1.171%	0	0.949%	0	0	0	0	0	0
ď	0	0	0	0	0	0	0	0	0	0	0	0	0	0.022%	0	0	0	0	0	0	0	0
dd	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	2.927%	0	0	0	0	0	0
ð	0.0004%	0	0	0	0	0	0	0	0	0	0	4.393%	0	0	0	0	0.0001%	0	0	0	0	0
è	0.002%	0.271%	0	~0%	0	0.263%	0	0	0	0	0	0	0	0	0	0.0005%	0.0004%	0	0	0	0	0
é	0.011%	1.504%	0	0.433%	0.337%	0	0	0	~0%	0	0	0.647%	0	1.335%	4.25%	0.0001%	0.004%	0	0	0	0	0
ê	0.0003%	0.218%	0	0	0.450%	~0%	0	0	0	0	0	0	0	0	0	0.026%	0.0001%	0	0	0	0	0
ë	0.0006%	0.008%	0	0	0	0	0	0	0	0	0	0	0	0	0	0.002%	0.0002%	0	0	0	0	0
ė	0.00005%	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1.664%	0	0	0	0	0
ę	0.0001%	0	0	0	0	0	0	0	1.131%	0	0	0	0	0	0	0	0.172%	0	0	0	0	0
ě	0.00008%	0	0	0	0	0	0	0	0	0	0	0	0	1.646%	0	0	0	0	0	0	0	0
ē	0.0003%	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.0004%	0	0	0	0	0
ff	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.382%	0	0	0	0	0	0
ĝ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.74%	0	0	0
ğ	0.0001%	0	0	0	0	0	1.125%	0	0	0	0	0	0	0	0	0	0.0001%	0	0	0	0	0
ng	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.366%	0	0	0	0	0	0
ĥ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.04%	0	0	0
î	0.0002%	0.045%	0	0	0	~0%	~0%	0	0	0	0	0	0	0	0	0.008%	0.0001%	0	0	1.40%	0	0
ì	0.0001%	0	0	0	0	(0.030%)	0	0	0	0	0	0	0	0	0	0.0001%	0.0001%	0	0	0	0	0
í	0.003%	0	0	0.725%	0.132%	0.030%	0	0	0	0	0	1.570%	0	3.270%	0.47%	~0%	0.002%	0	0	0	0	0
ï	0.0002%	0.005%	0	0	0	0	0	0	0	0	0	0	0	0	0	0.008%	0	0	0	0	0	0
ı	0.0002%	0	0	0	0	0	5.114%*	0	0	0	0	0	0	0	0	0	0.0002%	0	0	0	0	0
į	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.485%	0	0	0	0	0
ī	0.0005%	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.0007%	0	0	0	0	0
ĵ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.12%	0	0	0
ł	0.0007%	0	0	0	0	0	0	0	1.746%	0	0	0	0	0	0	0	0.001%	0	0	0	0	0
ľ	0	0	0	0	0	0	0	0	0	0	0	0	0	~0%	0	0	0	0	0	0	0	0
ll	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1.031%	0	0	0	0	0	0
ñ	0.0009%	0	0	0.311%	0	0	0	0	0	0	0	0	0	0	0	0	0.0005%	0	0	0	0	0
ń	0.0002%	0	0	0	0	0	0	0	0.185%	0	0	0	0	0	0	0	0.0003%	0	0	0	0	0
ň	0	0	0	0	0	0	0	0	0	0	0	0	0	0.081%	0	0	0	0	0	0	0	0
ņ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.0001%	0	0	0	0	0
ò	0.0002%	0	0	0	0	0.002%	0	0	0	0	0	0	0	0	0	0.0002%	0.0001%	0	0	0	0	0
ö	0.003%	0	0.443%	0	0	0	0.777%	1.31%	0	0	0	0.777%	0.444%	0	0.784%	0.002%	0.001%	0	0	0	0	0
ô	0.0005%	0.023%	0	0	0.635%	~0%	0	0	0	0	0	0	0	0	0	0.101%	0.0001%	0	0	0	0	0
ó	0.003%	0	0	0.827%	0.296%	~0%	0	0	0.823%	0	0	0.994%	0	0.031%	0.597%	0.0002%	0.002%	0	0	0	0	0
ő	0.00008%	0	0	0	0	0	0	0	0	0	0	0	0	0	0.823%	0	0	0	0	0	0	0
õ	0.00005%	0	0	0	0.040%	0	0	0	0	0	0	0	0	0	0	0	0.0001%	0	0	0	0	0
ø	0.001%	0	0	0	0	0	0	0	0	0	0.939%	0	0	0	0	0	0.0003%	0	0	0	0	0
ph	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.066%	0	0	0	0	0	0
ř	0.0001%	0	0	0	0	0	0	0	0	0	0	0	0	1.217%	0	0	0	0	0	0	0	0
rh	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.398%	0	0	0	0	0	0
ŝ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.38%	0	0	0
ş	0.0003%	0	0	0	0	0	1.780%	0	0	0	0	0	0	0	0	0	0.0003%	0	0	1.55%	0	0
ś	0.0003%	0	0	0	0	0	0	0	0.683%	0	0	0	0	0	0	0	0.0002%	0	0	0	0	0
š	0.0008%	0	0	0	0	0	0	0	0	0	0	0	~0%	0.805%	0	0	1.134%	0.996%	0	0	0	0
ß	0.0003%	0	0.307%	0	0	0	0	0	0	0	0	0	0	0	0	0	0.0002%	0	0	0	0	0
ť	0	0	0	0	0	0	0	0	0	0	0	0	0	0.043%	0	0	0	0	0	0	0	0
ț	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1.00%	0	0
þ	0.0001%	0	0	0	0	0	0	0	0	0	0	1.455%	0	0	0	0	0	0	0	0	0	0
th	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1.294%	0	0	0	0	0	0
ù	0.00008%	0.058%	0	0	0	(0.166%)	0	0	0	0	0	0	0	0	0	0.000%	0.0001%	0	0	0	0	0
ú	0.0008%	0	0	0.168%	0.207%	0.166%	0	0	0	0	0	0.613%	0	0.103%	0.098%	~0%	0.0005%	0	0	0	0	0
û	0.0001%	0.060%	0	0	0	~0%	~0%	0	0	0	0	0	0	0	0	0.003%	0	0	0	0	0	0
ü	0.003%	0	0.995%	0.012%	0.026%	0	1.854%	0	0	0	0	0	0	0	0.617%	0.002%	0.001%	0	0	0	0	0
ű	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.117%	0	0	0	0	0	0	0
ů	0	0	0	0	0	0	0	0	0	0	0	0	0	0.695%	0	0	0	0	0	0	0	0
ŭ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.52%	0	0	0
ų	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1.2602%	0	0	0	0	0
ū	0.0007%	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.4079%	0	0	0	0	0
ẃ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	~0%	0	0	0	0	0	0
ẁ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	~0%	0	0	0	0	0	0
ŵ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.033%	0	0	0	0	0	0
ẅ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.0006%	0	0	0	0	0	0
ỳ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	~0%	0	0	0	0	0	0
ý	0.0001%	0	0	~0%	0	0	0	0	0	0	0	0.228%	0	1.072%	0	~0%	0.0001%	0	0	0	0	0
ŷ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	~0%	0	0	0	0	0	0
ÿ	0	~0%	0	0	0	0	0	0	0	0	0	0	0	0	0	0.0005%	0	0	0	0	0	0
ź	0	0	0	0	0	0	0	0	0.061%	0	0	0	0	0	0	0	0	0	0	0	0	0
ż	0.00009%	0	0	0	0	0	0	0	0.885%	0	0	0	0	0	0	0	0.0002%	0	0	0	0	0
ž	0.0003%	0	0	0	0	0	0	0	0	0	0	0	~0%	0.995%	0	0	0.797%	0.646%	0	0	0	0

*: İ および ı を参照。

下記の図はいくつかの国におけるラテン文字26文字の出現頻度を可視化したものである。各国はいずれも英語と同様に25文字程度のアルファベットを使用している^[82]。

エスペラント語
スペイン語
ポルトガル語
イタリア語
フランス語
英語
ドイツ語
オランダ語
スウェーデン語
ポーランド語
トルコ語

出現頻度のランキング

以下の表はいくつかの言語において出現頻度の高い10文字を並べたものである。

言語	順序	言語系統	語派
英語	etaoin shrdlu	インド・ヨーロッパ語族	ゲルマン語派
フランス語^{[注釈 2]}	esait nrulo		ロマンス諸語
スペイン語	eaosr nidlc
ポルトガル語	aeosr indmu
イタリア語	eaion lrtsc
ドイツ語	enisr atdhu		ゲルマン語派
スウェーデン語	eantr slido
オランダ語^[84]	enati rodsl
ポーランド語	aoiez nscwr		スラヴ語派
トルコ語	aeinr lıdkm	アルタイ諸語	チュルク語族
フィンランド語	aitne sloku	ウラル語族	フィン・ウゴル語派
エスペラント語	aieon lsrtk	人工言語	主にロマンス諸語、ゲルマン語派の影響を受けている。

キリル文字を使用する言語における相対出現頻度

以下の表はキリル文字を使用する言語における文字の出現頻度を表している。

ロシア語は Stefan Trost の分析結果をまとめたものである。分析には "WordCreator" の機能 Unicode Counter を使用した。分析にあたって利用したコーパスは 1,351,370文字（210,844単語）のもので、そのうち 1,086,255文字を集計している^[85]。ただし、分析するコーパスによっては相対出現頻度は多少異なることがある。

ロシア語における出現頻度の高い文字（アルファベット）は ⟨O⟩、⟨E⟩、⟨A⟩ となる^[85]。

文字	ロシア語^[85]	マケドニア語^[86]	タジク語^[87]^[88]	ウクライナ語^[89]	カザフ語^[90]	セルビア語^[91]	シュグナン語^[92]	ルシャン語^[93]	ウズベク語^[94]	ブルガリア語^[95]	モンゴル語^[96]	ベラルーシ語^[97]	タタール語^[98]	キルギス語^[99]
А	7.50%	13.293%	16.54%	8.07%	12.796%	12.182%	11.100%	14.779%	15.203%	12.323%	12.098%	15.52%	11.006%	13.56%
Б	2.01%	1.434%	4.45%	1.77%	1.823%	1.590%	1.745%	1.742%	3.655%	1.533%	2.543%	1.78%	2.798%	3.32%
В	4.33%	4.343%	1.58%	5.35%	0.083%	3.636%	1.795%	1.667%	1.248%	4.449%	1.299%	2.90%	0.757%	0.06%
Г	1.72%	1.505%	1.87%	1.55%	1.339%	1.741%	0.914%	1.436%	3.462%	1.567%	6.464%	1.91%	2.913%	2.73%
Д	3.09%	3.911%	6.77%	3.38%	5.060%	3.719%	7.488%	6.909%	4.322%	3.526%	4.514%	2.72%	3.052%	4.10%
Е	8.50%	8.945%	2.13%	4.95%	8.391%	9.383%	3.103%	1.799%	1.711%	8.972%	0.375%	3.46%	7.218%	4.76%
Ё	0.20%	0	0.54%	0	0.002%	0	0	0	0.563%	0	0.134%	0.36%	0.000%	0.007%
Ж	1.01%	0.568%	0.07%	0.93%	1.095%	0.604%	0.085%	0.166%	0.523%	0.708%	1.732%	0.58%	0.065%	2.47%
З	1.48%	1.979%	2.43%	2.32%	1.624%	1.620%	1.814%	2.241%	1.627%	2.292%	1.036%	2.43%	1.485%	1.46%
И	7.09%	9.160%	7.35%	6.26%	1.285%	9.443%	8.332%	6.823%	13.813%	8.875%	4.474%	0.03%	4.438%	3.15%
Й	1.21%	0	0.71%	1.38%	1.743%	0	3.727%	3.940%	1.564%	0.590%	4.296%	1.20%	1.086%	2.18%
К	3.30%	3.672%	2.71%	3.54%	2.421%	3.748%	1.979%	1.917%	2.852%	3.390%	0.186%	3.35%	4.995%	6.90%
Л	4.96%	2.959%	1.24%	3.69%	5.670%	3.077%	2.073%	1.931%	6.072%	3.284%	6.160%	3.35%	6.516%	5.09%
М	3.10%	2.309%	4.19%	3.03%	3.025%	3.587%	3.664%	3.845%	3.415%	2.465%	2.241%	2.64%	2.997%	2.61%
Н	6.70%	7.077%	6.84%	6.81%	6.216%	5.268%	5.475%	5.437%	7.120%	7.136%	8.183%	6.31%	7.129%	6.38%
О	11.07%	10.679%	8.45%	9.42%	2.430%	9.907%	4.310%	4.540%	4.648%	9.079%	4.760%	3.41%	1.796%	3.52%
П	2.47%	2.926%	1.05%	2.90%	1.451%	2.780%	1.308%	1.504%	0.543%	2.928%	0.108%	2.49%	1.393%	2.88%
Р	4.33%	5.090%	7.35%	4.48%	5.972%	4.596%	4.971%	5.366%	5.740%	4.920%	5.289%	4.63%	6.818%	6.65%
С	4.97%	4.751%	2.74%	4.24%	4.016%	4.977%	2.587%	2.738%	2.623%	5.081%	2.984%	3.82%	2.834%	2.56%
Т	5.97%	7.462%	3.57%	5.35%	6.028%	4.215%	5.690%	5.092%	4.104%	7.604%	3.431%	3.45%	5.289%	5.70%
У	2.22%	2.262%	4.67%	3.36%	1.636%	4.640%	4.748%	5.843%	3.306%	1.312%	3.780%	2.48%	2.598%	4.15%
Ф	0.21%	0.347%	1.10%	0.28%	0.087%	0.184%	0.589%	1.242%	0.444%	0.210%	0.027%	0.18%	0.409%	0.06%
Х	0.95%	0.146%	1.54%	1.19%	0.157%	0.684%	2.431%	2.440%	0.703%	0.655%	4.830%	1.12%	0.722%	0.03%
Ц	0.39%	0.857%	0	0.83%	0.120%	0.713%	0.941%	0.638%	0.057%	0.595%	0.705%	2.31%	0.166%	0.003%
Ч	1.40%	0.925%	0.84%	1.41%	0.005%	1.077%	1.456%	1.403%	1.263%	1.338%	1.222%	1.42%	1.481%	1.20%
Ш	0.72%	0.916%	2.61%	0.76%	1.343%	1.206%	0.700%	0.660%	2.036%	0.615%	0.837%	1.02%	1.788%	1.61%
Щ	0.30%	0	0	0.56%	0.002%	0	0	0	0	0.612%	0.0003%	0	0.006%	0%
Ъ	0.02%	0	0.13%	0	0.008%	0	0	0	0.193%	1.832%	~0%	0.01%	0.109%	0%
Ы	2.36%	0	0	0	7.974%	0	0	0	0	0	1.246%	4.56%	5.522%	5.54%
Ь	1.84%	0	0	1.77%	0.037%	0	0	0	0.192%	0.014%	0.721%	1.18%	0.403%	0.007%
Э	0.36%	0	0.13%	0	0.045%	0	0	0	0.505%	0	7.612%	1.05%	0.293%	0.94%
Ю	0.47%	0	0.05%	0.93%	0.031%	0	0	0	0.216%	0.138%	0.240%	0.69%	0.189%	0.10%
Я	1.96%	0	0.58%	2.48%	0.343%	0	0	0	0.558%	1.957%	0.528%	3.16%	1.085%	0.12%
А̄	0	0	0	0	0	0	2.811%	3.036%	0	0	0	0	0	0
ә	0	0	0	0	0.777%	0	0	0	0	0	0	0	6.647%	0
В̌	0	0	0	0	0	0	2.658%	2.357%	0	0	0	0	0	0
Ѓ	0	0.106%	0	0	0	0	0	0	0	0	0	0	0	0
Ғ	0	0	0.23%	0	1.863%	0	0.489%	0.276%	0.435%	0	0	0	0	0
Г̌	0	0	0	0	0	0	0.414%	0.238%	0	0	0	0	0	0
Д̌	0	0	0	0	0	0	1.456%	1.251%	0	0	0	0	0	0
Ђ	0	0	0	0	0	0.258%	0	0	0	0	0	0	0	0
Ӗ	0	0	0	0	0	0	0.254%	0	0	0	0	0	0	0
Є	0	0	0	0.61%	0	0	0	0	0	0	0	0	0	0
Җ	0	0	0	0	0	0	0	0	0	0	0	0	0.463%	0
Ҙ	0	0	0	0	0	0	0.163%	0.146%	0	0	0	0	0	0
Ѕ	0	0.009%	0	0	0	0	0	0	0	0	0	0	0	0
Ӣ	0	0	0.66%	0	0	0	1.304%	1.020%	0	0	0	0	0	0
І	0	0	0	0%	6.160%	0	0	0	0	0	0	5.09%	0	0
Ї	0	0	0	0.65%	0	0	0	0	0	0	0	0	0	0
Ј	0	1.511%	0	0	0	3.282%	0	0	0	0	0	0	0	0
Ќ	0	0.264%	0	0	0	0	0	0	0	0	0	0	0	0
Қ	0	0	0.39%	0	2.782%	0	0.738%	0.588%	2.470%	0	0	0	0	0
Љ	0	0.015%	0	0	0	0.504%	0	0	0	0	0	0	0	0
ң	0	0	0	0	1.294%	0	0	0	0	0	0	0	1.014%	0.87%
Њ	0	0.555%	0	0	0	0.727%	0	0	0	0	0	0	0	0
Ӧ	0	0	0	0	0	0	0	0.230%	0	0	0	0	0	0
О̄	0	0	0	0	0	0	0	0.644%	0	0	0	0	0	0
ө	0	0	0	0	0.973%	0	0	0	0	0	2.733%	0	0.905%	2.91%
Т̌	0	0	0	0	0	0	0.479%	0.531%	0	0	0	0	0	0
Ћ	0	0	0	0	0	0.617%	0	0	0	0	0	0	0	0
Ў	0	0	0	0	0	0	1.668%	0	0	0	0	1.95%	0	0
Ӯ	0	0	1.18%	0	0	0	0.964%	0.136%	1.822%	0	0	0	0	0
У̊	0	0	0	0	0	0	0	0.078%	0	0	0	0	0	0
Ү	0	0	0	0	0.887%	0	0	0	0	0	3.210%	0	1.212%	3.27%
ұ	0	0	0	0	0.998%	0	0	0	0	0	0	0	0	0
Ҳ	0	0	2.55%	0	0	0	0	0	1.165%	0	0	0	0	0
Х̌	0	0	0	0	0	0	1.358%	1.370%	0	0	0	0	0	0
һ	0	0	0	0	0.008%	0	0	0	0	0	0	0	0.404%	0
Ҷ	0	0	0.74%	0	0	0	1.140%	1.047%	0	0	0	0	0	0
Џ	0	0.025%	0	0	0	0	0	0	0	0	0	0	0	0

アラビア文字を使用する言語における相対出現頻度

→詳細は「アラビア文字の出現頻度（英語版）」を参照

アラビア文字における文字の出現頻度は以下の表の通りとなる。アラビア語の分析において使用したデータにおける語の総数は 1,297,259語、文字の総数は 5,122,132文字である^[100]。

文字	アラビア語^[100]	ウイグル語^[101]^[102]	ペルシア語^[103]	ウルドゥー語^[104]	マレー語^[105]	シンド語^[106]
ا	12.50%	8.23%	19.979%	12.235%	15.127%	11.725%
آ	0.15%	0	0	0.472%	0	0
أ	2.89%	0	0	0	0	0
إ	1.00%	0	0	0	0	0
ب	4.67%	1.98%	5.495%	2.713%	3.838%	2.104%
ٻ	0	0	0	0	0	0.363%
ڀ	0	0	0	0	0	0.260%
پ	0	2.00%	0.826%	1.661%	0.701%	1.788%
ت	2.61%	4.84%	6.191%	3.848%	5.756%	3.228%
ٿ	0	0	0	0	0	0.845%
ٽ	0	0	0	0	0	0.818%
ٺ	0	0	0	0	0	0.268%
ٹ	0	0	0	0.764%	0	0
ث	0.87%	0	0.182%	0.127%	0.071%	0.113%
ج	1.23%	0.52%	1.325%	1.535%	2.386%	3.786%
ڄ	0	0	0	0	0	0.139%
جهہ	0	0	0	0	0	0.683%
ڃ	0	0	0	0	0	0.149%
چ	0	1.33%	0.462%	0.651%	0.437%	0.689%
ڇ	0	0	0	0	0	0.245%
ح	1.86%	0	1.187%	0.911%	0.477%	0.872%
خ	0.79%	0.68%	1.589%	0.641%	0.152%	0.587%
د	2.67%	2.70%	9.027%	2.601%	5.289%	2.538%
ڌ	0	0	0	0	0	0.486%
ڏ	0	0	0	0	0	0.817%
ڊ	0	0	0	0	0	0.352%
ڍ	0	0	0	0	0	0.091%
ڈ	0	0	0	0.333%	0	0
ذ	0.96%	0	0.260%	0.144%	0.041%	0.142%
ر	4.20%	5.28%	5.896%	6.668%	5.543%	5.968%
ڙ	0	0	0	0	0	0.624%
ڑ	0	0	0	0.260%	0	0
ز	0.52%	1.38%	2.721%	0.825%	0.122%	0.603%
ژ	0	0.02%	0.122%	0.005%	0.030%	0
س	2.47%	2.82%	2.181%	3.611%	5.503%	3.341%
ش	0.73%	2.34%	1.721%	0.967%	0.234%	0.883%
ص	1.04%	0	0.458%	0.595%	0.152%	0.500%
ض	0.44%	0	0.200%	0.260%	0.030%	0.183%
ط	0.50%	0	0.373%	0.401%	0.061%	0.322%
ظ	0.18%	0	0.137%	0.189%	0.010%	0.184%
ع	4.01%	0	0.860%	1.156%	0.589%	0.997%
غ	0.33%	1.19%	0.140%	0.182%	0.010%	0.146%
ف	2.84%	0.16%	0.953%	0.994%	0.345%	0.797%
ڤ	0	0	0	0	3.563%	0
ڦ	0	0	0	0	0	0.044%
ق	2.69%	4.21%	0.782%	0.989%	1.289%	0.828%
ك	2.04%	3.36%	0.401%	0	0	0
ڭ	0	1.08%	0	0	0	0
ڪ	0	0	0	0	0	0.319%
ک	0	0	0	7.107%	3.056%	1.240%
گ	0	0.94%	0.920%	1.169%	1.462%	0.890%
ڳ	0	0	0	0	0	0.166%
گهہ	0	0	0	0	0	0.396%
ڱ	0	0	0	0	0	0.025%
ل	12.07%	5.34%	3.315%	3.481%	5.279%	3.305%
م	6.52%	3.83%	7.150%	4.879%	5.756%	3.833%
ن	6.61%	5.16%	8.970%	5.040%	9.695%	9.630%
ڻ	0	0	0	0	0	1.153%
ں	0	0	0	2.670%	0	0
و	5.80%	2.23%	7.326%	6.046%	8.660%	8.170%
ۇ	0	3.60%	0	0	0	0
ۆ	0	0.77%	0	0	0	0
ۈ	0	1.47%	0	0	0	0
ۋ	0	0.92%	0	0	0	0
ؤ	0.09%	0	0	0.059%	0	0
ه	5.08%	0	8.160%	0	3.046%	0
ە	0	6.07%	0	0	0	0
ہ	0	0	0	5.441%	0	0
ة	1.42%	0	0	0.004%	0	0
ۂ	0	0	0	0.008%	0	0
ھ	0	0.82%	0	1.455%	0	6.567%
ء	0.31%	3.64%	0.189%	0.045%	0.315%	2.139%
ى	1.29%	15.41%	0	0	0.041%	0
ی	0	0	0	10.453%	0	0
ي	6.36%	2.87%	0.502%	0	9.726%	13.659%
ې	0	1.86%	0	0	0	0
ئ	0.28%	0	0	1.208%	0	0
ے	0	0	0	5.193%	0	0
ۓ	0	0	0	0.003%	0	0
لا	0	0.93%	0	0	0	0
ال	0	0	0	0	1.208%	0

ペルシア語に関してはペルシア文字を、ウルドゥー語に関してはウルドゥー文字を、マレー語に関してはジャウィ文字を参照。

ブラーフミー系文字を使用する言語における文字の相対出現頻度

以下では主に南アジア、東南アジアの言語で使用されているブラーフミー系文字（インド系文字）における文字の相対出現頻度についてまとめる。

デーヴァナーガリーを使用する言語

ヒンディー語

以下の表は Stefan Trost の分析結果をまとめたものである。分析には "WordCreator" の機能 Unicode Counter を使用した。分析にあたって利用したコーパスは 978,430文字（238,604単語）のもので、そのうち 736,216文字を集計している^[107]。ただし、分析するコーパスによっては相対出現頻度は多少異なることがある。

ヒンディー語における出現頻度の高い文字（デーヴァナーガリー）は ⟨ ा⟩、⟨क⟩、⟨ े⟩ となる^[107]。

文字	ヒンディー語における文字の出現頻度^[107]
ँ	0.30%	0.3
ं	3.44%	3.44
ः	0.01%	0.01
अ	1.01%	1.01
आ	0.66%	0.66
इ	0.31%	0.31
ई	0.20%	0.2
उ	0.78%	0.78
ऊ	0.05%	0.05
ऋ	0.00%
ए	1.34%	1.34
ऐ	0.03%	0.03
ऑ	0.03%	0.03
ओ	0.10%	0.1
औ	0.94%	0.94
क	7.14%	7.14
ख	0.70%	0.7
ग	1.31%	1.31
घ	0.20%	0.2
च	1.16%	1.16
छ	0.45%	0.45
ज	1.39%	1.39
झ	0.19%	0.19
ञ	0.01%	0.01
ट	0.57%	0.57
ठ	0.17%	0.17
ड	0.75%	0.75
ढ	0.09%	0.09
ण	0.13%	0.13
त	2.89%	2.89
थ	1.15%	1.15
द	1.68%	1.68
ध	0.36%	0.36
न	3.48%	3.48
प	2.66%	2.66
फ	0.35%	0.35
ब	1.78%	1.78
भ	0.67%	0.67
म	3.28%	3.28
य	2.20%	2.2
र	5.91%	5.91
ल	2.45%	2.45
व	1.62%	1.62
श	0.76%	0.76
ष	0.27%	0.27
स	3.78%	3.78
ह	4.82%	4.82
़	0.67%	0.67
ा	8.22%	8.22
ि	3.20%	3.2
ी	3.47%	3.47
ु	1.45%	1.45
ू	0.81%	0.81
ृ	0.10%	0.1
ॅ	0.00%
े	6.85%	6.85
ै	1.96%	1.96
ॉ	0.10%	0.1
ो	2.21%	2.21
ौ	0.15%	0.15
्	3.02%	3.02

ガルワーリー語

ガルワーリー語における文字（デーヴァナーガリー）の出現頻度は以下の表の通りである^[108]。

文字	ガルワーリー語における相対出現頻度
र	3.656%	3.656
न	3.112%	3.112
क	2.403%	2.403
ल	2.116%	2.116
प	2.077%	2.077
म	1.779%	1.779
स	1.698%	1.698
द	1.362%	1.362
अ	1.355%	1.355
ज	1.320%	1.32
ब	1.227%	1.227
ण	1.195%	1.195
त	1.116%	1.116
च	1.048%	1.048
ट	0.984%	0.984
य	0.905%	0.905
ग	0.823%	0.823
आ	0.710%	0.71
इ	0.670%	0.67
ह	0.592%	0.592
व	0.514%	0.514
ए	0.470%	0.47
छ	0.406%	0.406
ड	0.364%	0.364
थ	0.301%	0.301
ख	0.277%	0.277
उ	0.234%	0.234
फ	0.190%	0.19
श	0.189%	0.189
भ	0.173%	0.173
ध	0.160%	0.16
ढ	0.160%	0.16
ई	0.148%	0.148
ट	0.136%	0.136
ओ	0.098%	0.098
ष	0.082%	0.082
ऐ	0.033%	0.033
ऊ	0.031%	0.031
औ	0.023%	0.023
ङ	0.019%	0.019
घ	0.009%	0.009
झ	0.006%	0.006

また、ガルワーリー語の母音のみの出現頻度は以下の通りとなる^[108]。

文字	相対出現頻度
अ	26.336%	26.336
आ	10.476%	10.476
इ	6.844%	6.844
ई	4.168%	4.168
ए	3.670%	3.67
उ	3.357%	3.357
ओ	1.713%	1.713
ऐ	1.051%	1.051
औ	0.081%	0.081
ऊ	0.074%	0.074

マラーティー語

マラーティー語における文字（デーヴァナーガリー）の出現頻度上位100文字は以下の表の通りである^[109]。

順位	文字	マラーティー語における相対出現頻度
1	त	3.657%	3.657
2	र	3.413%	3.413
3	क	2.803%	2.803
4	न	2.760%	2.76
5	व	2.573%	2.573
6	अ	2.055%	2.055
7	स	2.026%	2.026
8	प	1.693%	1.693
9	ल	1.661%	1.661
10	आ	1.648%	1.648
11	का	1.497%	1.497
12	म	1.378%	1.378
13	च्या	1.175%	1.175
14	ता	1.137%	1.137
15	ले	1.078%	1.078
16	वि	1.064%	1.064
17	वा	1.044%	1.044
18	ती	1.010%	1.01
19	ला	1.002%	1.002
20	ना	0.962%	0.962
21	सा	0.959%	0.959
22	मा	0.951%	0.951
23	या	0.930%	0.93
24	प्र	0.930%	0.93
25	रा	0.925%	0.925
26	ग	0.925%	0.925
27	य	0.908%	0.908
28	ते	0.889%	0.889
29	ण	0.845%	0.845
30	चा	0.804%	0.804
31	चे	0.799%	0.799
32	हे	0.755%	0.755
33	ने	0.715%	0.715
34	ज	0.694%	0.694
35	च	0.680%	0.68
36	द	0.666%	0.666
37	ची	0.660%	0.66
38	पा	0.647%	0.647
39	उ	0.635%	0.635
40	ही	0.625%	0.625
41	सं	0.601%	0.601
42	नि	0.593%	0.593
43	ब	0.587%	0.587
44	त्या	0.582%	0.582
45	हो	0.577%	0.577
46	ड	0.572%	0.572
47	ली	0.570%	0.57
48	री	0.562%	0.562
49	णा	0.544%	0.544
50	श	0.537%	0.537
51	ट	0.529%	0.529
52	ळ	0.507%	0.507
53	ह	0.504%	0.504
54	हा	0.500%	0.5
55	ल्या	0.466%	0.466
56	के	0.451%	0.451
57	जा	0.441%	0.441
58	भा	0.441%	0.441
59	ए	0.419%	0.419
60	ण्या	0.410%	0.41
61	इ	0.397%	0.397
62	मु	0.397%	0.397
63	नी	0.382%	0.382
64	शा	0.381%	0.381
65	दा	0.367%	0.367
66	तो	0.364%	0.364
67	ये	0.349%	0.349
68	सू	0.348%	0.348
69	रि	0.348%	0.348
70	ध	0.345%	0.345
71	णि	0.345%	0.345
72	यां	0.339%	0.339
73	रू	0.331%	0.331
74	से	0.331%	0.331
75	ति	0.329%	0.329
76	रे	0.315%	0.315
77	णे	0.311%	0.311
78	वे	0.302%	0.302
79	त्यां	0.296%	0.296
80	गा	0.294%	0.294
81	दे	0.293%	0.293
82	ख	0.291%	0.291
83	मि	0.282%	0.282
84	शि	0.281%	0.281
85	झा	0.275%	0.275
86	ध्ये	0.262%	0.262
87	हि	0.253%	0.253
88	बा	0.250%	0.25
89	ळे	0.249%	0.249
90	पु	0.242%	0.242
91	मी	0.238%	0.238
92	त्र	0.238%	0.238
93	क्ष	0.231%	0.231
94	दि	0.228%	0.228
95	ढ	0.227%	0.227
96	सु	0.226%	0.226
97	की	0.226%	0.226
98	म्ह	0.225%	0.225
99	शी	0.224%	0.224
100	धा	0.211%	0.211

ベンガル語

ベンガル語で使用されるベンガル文字における文字の出現頻度は以下の表の通りである^[110]。

文字	ベンガル語における相対出現頻度
া	12.966%	12.966
ে	7.812%	7.812
র	6.627%	6.627
ি	5.221%	5.221
ন	5.503%	5.503
ত	4.356%	4.356
ক	4.341%	4.341
ব	3.814%	3.814
ম	3.189%	3.189
ল	3.094%	3.094
প	2.908%	2.908
হ	2.652%	2.652
অ	2.393%	2.393
স	2.381%	2.381
দ	2.363%	2.363
য়	1.895%	1.895
ু	1.259%	1.259
ী	1.191%	1.191
য	1.176%	1.176
জ	1.025%	1.025
শ	0.907%	0.907
ছ	0.855%	0.855
গ	0.813%	0.813
ও	0.804%	0.804
খ	0.684%	0.684
ং	0.648%	0.648
ধ	0.603%	0.603
ট	0.567%	0.567
ষ	0.547%	0.547
থ	0.524%	0.524
ভ	0.442%	0.442
ূ	0.432%	0.432
ণ	0.426%	0.426
চ	0.405%	0.405
ঃ	0.364%	0.364
ফ	0.280%	0.28
ঁ	0.258%	0.258
ড়	0.202%	0.202
ড	0.142%	0.142
ৎ	0.140%	0.14
ঠ	0.128%	0.128
ঘ	0.109%	0.109
ঞ	0.086%	0.086
ঔ	0.084%	0.084
ৈ	0.047%	0.047
ঝ	0.040%	0.04
ঢ	0.032%	0.032
ঢ়	0.013%	0.013
ঙ	0.006%	0.006
ৃ	0.003%	0.003

またベンガル語の辞書の見出し語における文字の出現頻度は া ্র িন তকবপ ু মসলদ ে োঅগযচ জশ ীটহ য়ষধভণ ড়আ ঁখউ ৃফ ংূঙ ছইডথঘ ঞঠ ৈ ৌঝ ওএ ঃঢঢ় ঈঐঔঋঊৎ の順である^[111]。

タイ語

タイ語のタイ文字における文字の出現頻度は以下の表の通りとなる^[112]。分析に使用したデータにおける文字の総数は 354,221,260文字である^[112]。

順位	文字	度数	割合
1	า	25,209,774	7.12%	7.12
2	ร	22,980,559	6.49%	6.49
3	น	21,539,571	6.08%	6.08
4	ก	15,639,107	4.42%	4.42
5	่	15,567,843	4.39%	4.39
6	อ	14,043,669	3.96%	3.96
7	เ	13,502,777	3.81%	3.81
8	ง	13,446,596	3.80%	3.8
9	้	12,088,661	3.41%	3.41
10	ั	11,622,044	3.28%	3.28
11	ม	11,480,076	3.24%	3.24
12	ย	11,414,497	3.22%	3.22
13	ว	9,370,549	2.65%	2.65
14	ี	9,345,532	2.64%	2.64
15	ท	8,848,508	2.50%	2.5
16	ด	8,219,261	2.32%	2.32
17	ล	8,098,263	2.29%	2.29
18	ิ	7,284,384	2.06%	2.06
19	ต	7,048,841	1.99%	1.99
20	ห	6,658,952	1.88%	1.88
21	ส	6,652,219	1.88%	1.88
22	บ	6,467,847	1.83%	1.83
23	ะ	6,424,503	1.81%	1.81
24	ค	6,148,224	1.74%	1.74
25	ป	6,002,429	1.69%	1.69
26	จ	5,808,506	1.64%	1.64
27	แ	4,568,250	1.29%	1.29
28	ไ	4,255,053	1.20%	1.2
29	พ	4,029,354	1.14%	1.14
30	ข	4,028,758	1.14%	1.14
31	ใ	3,834,242	1.08%	1.08
32	ช	3,773,356	1.07%	1.07
33	ุ	3,656,069	1.03%	1.03
34	ื	3,655,755	1.03%	1.03
35	์	2,919,201	0.82%	0.82
36	ู	2,724,773	0.77%	0.77
37	็	2,690,261	0.76%	0.76
38	ำ	2,562,973	0.72%	0.72
39	โ	1,951,275	0.55%	0.55
40	ธ	1,816,470	0.51%	0.51
41	ึ	1,772,343	0.50%	0.5
42	ผ	1,732,132	0.49%	0.49
43	ศ	1,529,376	0.43%	0.43
44	ถ	1,404,048	0.40%	0.4
45	ณ	1,365,793	0.39%	0.39
46	ซ	1,181,412	0.33%	0.33
47	ษ	1,154,037	0.33%	0.33
48	ญ	1,133,041	0.32%	0.32
49	ภ	975,323	0.28%	0.28
50	ฐ	745,057	0.21%	0.21
51	ฟ	499,872	0.14%	0.14
52	ฉ	485,706	0.14%	0.14
53	ๆ	339,092	0.10%	0.1
54	ฒ	234,963	0.07%	0.07
55	ฝ	215,652	0.06%	0.06
56	ฎ	196,316	0.06%	0.06
57	ฏ	147,910	0.04%	0.04
58	ฯ	142,585	0.04%	0.04
59	๊	139,272	0.04%	0.04
60	ฤ	138,806	0.04%	0.04
61	๒	138,759	0.04%	0.04
62	๑	131,819	0.04%	0.04
63	ฮ	119,534	0.03%	0.03
64	๐	113,603	0.03%	0.03
65	ฑ	106,731	0.03%	0.03
66	ฃ	105,505	0.03%	0.03
67	๕	96,032	0.03%	0.03
68	๓	80,281	0.02%	0.02
69	ฬ	66,704	0.02%	0.02
70	๔	65,882	0.02%	0.02
71	ฆ	55,074	0.02%	0.02
72	๖	42,917	0.01%	0.01
73	๋	40,740	0.01%	0.01
74	๗	35,667	0.01%	0.01
75	๘	33,296	0.01%	0.01
76	๙	29,240	0.01%	0.01
77	ฌ	27,089	0.01%	0.01
78	ฅ	13,107	0.00%
79	ํ	4,657	0.00%
80	ฦ	2,628	0.00%
81	ฺ	172	0.00%
82	฿	42	0.00%
83	ๅ	33	0.00%
84	๚	19	0.00%
85	๏	5	0.00%
86	๛	4	0.00%
87	๎	2	0.00%

タイ文字の子音における文字の出現頻度は高い順に รนกองมยวทดลตหสบคปจพขชธผศถณซษญภฐฟฉฒฝฎฏฤฮฑฃฬฆฌฅฦ である^[112]。またタイ文字の母音、記号、数字における文字の出現頻度は高い順に า ่เ ้ ั ี ิะแไใ ุ ื ์ ู ็ ำโ ึๆฯ ๊๒๑๐๕๓๔๖ ๋๗๘ ํ ฺ฿ๅ๚๏๛ ๎ である^[112]。

ビルマ語

ビルマ語で使用されるビルマ文字の基本字母における文字の出現頻度は以下の表の通りである^[113]。ビルマ文字では 33 の文字が基本字母として存在している^[113]。

文字	ビルマ語における相対出現頻度
က	7.449%	7.449
ခ	0.086%	0.086
ဂ	0.685%	0.685
ဃ	1.199%	1.199
င	1.455%	1.455
စ	11.301%	11.301
ဆ	3.168%	3.168
ဇ	2.226%	2.226
ဈ	0.086%	0.086
ည	0.599%	0.599
ဋ	0.086%	0.086
ဌ	7.020%	7.02
ဍ	10.103%	10.103
ဎ	1.370%	1.37
ဏ	2.055%	2.055
တ	5.051%	5.051
ထ	6.592%	6.592
ဒ	0.171%	0.171
ဓ	2.483%	2.483
န	5.651%	5.651
ပ	3.339%	3.339
ဖ	1.455%	1.455
ဗ	1.027%	1.027
ဘ	0.342%	0.342
မ	1.969%	1.969
ယ	8.818%	8.818
ရ	1.969%	1.969
လ	0.086%	0.086
ဝ	0.086%	0.086
သ	0%
ဟ	0%
ဠ	0%
အ	0%

また、ビルマ語の基本字母と併せて用いられる表音機能を持つ符号における出現頻度は以下の通りとなる^[113]。

文字	相対出現頻度
ြ	7.705%	7.705
၂	8.990%	8.99
ေ	12.842%	12.842
ါ	7.791%	7.791
း	2.997%	2.997
ံ	14.812%	14.812
့	29.966%	29.966
ိ	9.075%	9.075
ွ	3.767%	3.767
ှ	1.627%	1.627
ု	1.027%	1.027
ူ	1.284%	1.284
ဲ	9.161%	9.161
်	3.253%	3.253

タミル語

タミル語で使用されるタミル文字における文字の出現頻度は以下の表の通りである^{[注釈 3]}^[115]。

文字	タミル語における相対出現頻度
ஸ	0.15%	0.15
ஜ	0.16%	0.16
ு	0.86%	0.86
ூ	0.04%	0.04
ஶ்ரீ	0.04%	0.04
ொ	0.01%	0.01
ோ	0.01%	0.01
று	0.68%	0.68
ற	1.94%	1.94
நு	0.06%	0.06
ந	2.09%	2.09
சு	0.15%	0.15
ச	2.14%	2.14
கூ	0.19%	0.19
வ	3.61%	3.61
லு	0.23%	0.23
ல	3.05%	3.05
ரு	1.28%	1.28
ர	1.33%	1.33
ஐ	0.05%	0.05
ை	2.81%	2.81
டீ	0.01%	0.01
டி	0.67%	0.67
ீ	0.43%	0.43
ி	6.45%	6.45
றா	0.22%	0.22
ய	3.08%	3.08
ளு	0.21%	0.21
ள	2.03%	2.03
னு	0.18%	0.18
ன	3.78%	3.78
கு	1.06%	1.06
க	6.98%	6.98
ழு	0.14%	0.14
ப	4.57%	4.57
ழ	0.55%	0.55
ா	6.16%	6.16
து	1.55%	1.55
த	5.85%	5.85
மு	0.53%	0.53
ம	3.91%	3.91
டு	0.81%	0.81
ட	2.30%	2.3
ஂ	0.05%	0.05
்	18.48%	18.48
ஞ	0.10%	0.1
ங	0.63%	0.63
ணா	0.02%	0.02
ண	1.07%	1.07
ஓ	0.03%	0.03
ஒ	0.27%	0.27
ஊ	0.04%	0.04
உ	0.59%	0.59
ஏ	0.11%	0.11
எ	0.91%	0.91
னா	0.31%	0.31
ெ	0.91%	0.91
சூ	0.01%	0.01
ே	1.21%	1.21
ஆ	0.35%	0.35
அ	1.27%	1.27
ஈ	0.03%	0.03
இ	1.03%	1.03
ஃ	0.00%

シンハラ語

シンハラ語で使用されるシンハラ文字における文字の出現頻度は以下の表の通りである^[116]。

文字	シンハラ語における相対出現頻度
ං	0.738%	0.738
ඃ	0.002%	0.002
අ	1.403%	1.403
ආ	0.340%	0.34
ඇ	0.387%	0.387
ඈ	0.012%	0.012
ඉ	0.357%	0.357
ඊ	0.027%	0.027
උ	0.364%	0.364
ඌ	0.010%	0.01
ඍ	0.006%	0.006
ඎ	0.000%
ඏ	0.000%
ඐ	0.000%
එ	0.307%	0.307
ඒ	0.057%	0.057
ඓ	0.004%	0.004
ඔ	0.120%	0.12
ඕ	0.044%	0.044
ඖ	0.003%	0.003
ක	8.152%	8.152
ඛ	0.094%	0.094
ග	3.149%	3.149
ඝ	0.062%	0.062
ඞ	0.000%
ඟ	0.198%	0.198
ච	0.525%	0.525
ඡ	0.042%	0.042
ජ	0.783%	0.783
ඣ	0.000%
ඤ	0.020%	0.02
ඥ	0.080%	0.08
ඦ	0.000%
ට	3.749%	3.749
ඨ	0.052%	0.052
ඩ	1.097%	1.097
ඪ	0.007%	0.007
ණ	1.382%	1.382
ඬ	0.051%	0.051
ත	5.953%	5.953
ථ	0.235%	0.235
ද	4.449%	4.449
ධ	0.667%	0.667
න	10.643%	10.643
ඳ	0.370%	0.37
ප	4.233%	4.233
ඵ	0.021%	0.021
බ	1.622%	1.622
භ	0.379%	0.379
ම	6.226%	6.226
ඹ	0.178%	0.178
ය	8.347%	8.347
ර	7.493%	7.493
ල	4.915%	4.915
ව	8.728%	8.728
ශ	0.746%	0.746
ෂ	0.653%	0.653
ස	5.124%	5.124
හ	2.653%	2.653
ළ	0.928%	0.928
ෆ	0.124%	0.124
⟨්‍ය⟩	0.496%	0.496
⟨ර්‍◌⟩	0.000%
⟨◌්‍ර⟩	1.194%	1.194
෴	0%

マラヤーラム語

マラヤーラム語で使用されるマラヤーラム文字における文字の出現頻度は以下の表の通りである^[117]^[118]。

文字	マラヤーラム語における相対出現頻度
്	14.915%	14.915
ി	6.605%	6.605
ന	6.547%	6.547
ു	6.463%	6.463
ക	6.386%	6.386
ത	5.303%	5.303
ാ	4.462%	4.462
യ	3.720%	3.72
ര	3.261%	3.261
ട	3.167%	3.167
പ	2.932%	2.932
വ	2.637%	2.637
െ	2.632%	2.632
മ	2.508%	2.508
ല	2.272%	2.272
ം	2.269%	2.269
റ	1.784%	1.784
ച	1.668%	1.668
ണ	1.600%	1.6
സ	1.576%	1.576
ള	1.384%	1.384
ങ	1.288%	1.288
ോ	1.170%	1.17
േ	1.037%	1.037
അ	1.027%	1.027
ൽ	0.825%	0.825
ർ	0.825%	0.825
ദ	0.721%	0.721
ശ	0.600%	0.6
ൊ	0.549%	0.549
ൂ	0.525%	0.525
ഷ	0.502%	0.502
ൾ	0.500%	0.5
എ	0.495%	0.495
ീ	0.451%	0.451
ഞ	0.409%	0.409
ൻ	0.398%	0.398
ഗ	0.391%	0.391
ആ	0.366%	0.366
ധ	0.365%	0.365
ഴ	0.337%	0.337
ഇ	0.336%	0.336
ഒ	0.291%	0.291
ഭ	0.275%	0.275
ഹ	0.261%	0.261
ബ	0.246%	0.246
ഉ	0.228%	0.228
ജ	0.224%	0.224
ഥ	0.176%	0.176
ഡ	0.143%	0.143
ൈ	0.140%	0.14
ഫ	0.119%	0.119
ൃ	0.117%	0.117
ഖ	0.114%	0.114
ഈ	0.097%	0.097
ഏ	0.074%	0.074
ഓ	0.060%	0.06
ഠ	0.055%	0.055
ൺ	0.045%	0.045
ൗ	0.040%	0.04
ഘ	0.028%	0.028
ഊ	0.017%	0.017
ഛ	0.013%	0.013
ഐ	0.011%	0.011
ഃ	0.005%	0.005
ൌ	0.005%	0.005
ഢ	0.002%	0.002
ഔ	0.001%	0.001
ഋ	0.000%

カンナダ語

カンナダ語の母音におけるカンナダ文字の出現頻度は以下の表の通りである^[119]。

文字	相対出現頻度
ಅ	29.036%	29.036
ಆ	11.189%	11.189
ಇ	16.346%	16.346
ಈ	1.875%	1.875
ಉ	10.885%	10.885
ಊ	0.156%	0.156
ಋ	0.276%	0.276
ೠ	0.000%
ಌ	0.000%
ೡ	0.000%
ಎ	0.905%	0.905
ಏ	2.527%	2.527
ಐ	0.061%	0.061
ಒ	1.421%	1.421
ಓ	1.339%	1.339
ಔ	0.189%	0.189
ಁ	0.000%
ಂ	4.070%	4.07
ಃ	0.165%	0.165
಼	0.001%	0.001
್	19.561%	19.561

また、カンナダ語の子音におけるカンナダ文字の出現頻度は以下の通りとなる^[119]。

文字	相対出現頻度
್	5.663%	5.663
ಕ	6.219%	6.219
ಖ	0.348%	0.348
ಗ	6.168%	6.168
ಘ	0.131%	0.131
ಙ	0.0003%	0.0003
ಚ	1.241%	1.241
ಛ	0.023%	0.023
ಜ	1.355%	1.355
ಝ	0.011%	0.011
ಞ	0.040%	0.04
ಟ	2.136%	2.136
ಠ	0.075%	0.075
ಡ	2.741%	2.741
ಢ	0.014%	0.014
ಣ	0.943%	0.943
ತ	6.810%	6.81
ಥ	0.457%	0.457
ದ	7.860%	7.86
ಧ	0.800%	0.8
ನ	7.278%	7.278
ಪ	2.933%	2.933
ಫ	0.251%	0.251
ಬ	2.433%	2.433
ಭ	0.750%	0.75
ಮ	4.382%	4.382
ಯ	3.893%	3.893
ರ	10.270%	10.27
ಱ	0.001%	0.001
ಲ	6.394%	6.394
ಳ	2.778%	2.778
ೞ	0.0003%	0.0003
ವ	5.478%	5.478
ಶ	1.128%	1.128
ಷ	0.956%	0.956
ಸ	5.711%	5.711
ಹ	2.331%	2.331

テルグ語

テルグ語の母音におけるテルグ文字の出現頻度は以下の表の通りである^[120]。

文字	相対出現頻度
అ	19.224%	19.224
ఆ	12.826%	12.826
ఇ	13.133%	13.133
ఈ	3.180%	3.18
ఉ	11.556%	11.556
ఊ	1.321%	1.321
ఋ	0.189%	0.189
ౠ	0.000%
ఌ	0.000%
ౡ	0.000%
ఎ	2.585%	2.585
ఏ	4.079%	4.079
ఐ	1.107%	1.107
ఒ	0.959%	0.959
ఓ	4.071%	4.071
ఔ	0.128%	0.128
ఁ	0.001%	0.001
ం	7.934%	7.934
ః	0.071%	0.071
్	17.638%	17.638

また、テルグ語の子音におけるテルグ文字の出現頻度は以下の通りとなる^[120]。

文字	相対出現頻度
్	6.093%	6.093
క	7.431%	7.431
ఖ	0.231%	0.231
గ	3.300%	3.3
ఘ	0.077%	0.077
ఙ	0.0004%	0.0004
చ	3.809%	3.809
ఛ	0.032%	0.032
జ	1.481%	1.481
ఝ	0.002%	0.002
ఞ	0.018%	0.018
ట	4.072%	4.072
ఠ	0.039%	0.039
డ	3.322%	3.322
ఢ	0.027%	0.027
ణ	0.493%	0.493
త	5.731%	5.731
థ	0.369%	0.369
ద	4.624%	4.624
ధ	0.836%	0.836
న	9.127%	9.127
ప	5.648%	5.648
ఫ	0.404%	0.404
బ	1.459%	1.459
భ	0.750%	0.75
మ	4.536%	4.536
య	3.884%	3.884
ర	10.669%	10.669
ఱ	0.001%	0.001
ల	7.990%	7.99
ళ	0.428%	0.428
ఴ	0.000%
వ	4.896%	4.896
శ	1.059%	1.059
ష	1.024%	1.024
స	5.320%	5.32
హ	0.819%	0.819

その他の言語における文字の相対出現頻度

ギリシア語

以下の表は Stefan Trost の分析結果をまとめたものである。分析には "WordCreator" の機能 Unicode Counter を使用した。分析にあたって利用したコーパスは 1,442,382文字（235,614単語）のもので、そのうち 1,161,745文字を集計している^[121]。ただし、分析するコーパスによっては相対出現頻度は多少異なることがある。

ギリシア語における出現頻度の高い文字（ギリシア文字）は ⟨A⟩、⟨O⟩、⟨E⟩ となる^[121]。

文字	ギリシア語における文字の出現頻度^[121]
Α	12.98%	12.98
Β	0.74%	0.74
Γ	1.62%	1.62
Δ	1.55%	1.55
Ε	9.48%	9.48
Ζ	0.31%	0.31
Η	4.78%	4.78
Θ	1.16%	1.16
Ι	9.18%	9.18
Κ	3.66%	3.66
Λ	2.54%	2.54
Μ	3.55%	3.55
Ν	6.17%	6.17
Ξ	0.42%	0.42
Ο	9.48%	9.48
Π	3.95%	3.95
Ρ	4.12%	4.12
Σ	6.67%	6.67
Τ	7.89%	7.89
Υ	3.96%	3.96
Φ	0.72%	0.72
Χ	1.26%	1.26
Ψ	0.15%	0.15
Ω	1.71%	1.71

ヘブライ語

以下の表は Stefan Trost の分析結果をまとめたものである。分析には "WordCreator" の機能 Unicode Counter を使用した。分析にあたって利用したコーパスは 1,230,923文字（279,679単語）のもので、そのうち 937,426文字を集計している^[122]。ただし、分析するコーパスによっては相対出現頻度は多少異なることがある。

ヘブライ語における出現頻度の高い文字（ヘブライ文字）は ⟨י⟩、⟨ה⟩、⟨ו⟩ となる^[122]。

文字	ヘブライ語における文字の出現頻度^[122]
א	6.11%	6.11
ב	4.57%	4.57
ג	1.26%	1.26
ד	2.49%	2.49
ה	10.48%	10.48
ו	10.01%	10.01
ז	1.28%	1.28
ח	2.39%	2.39
ט	1.19%	1.19
י	10.67%	10.67
ך	0.78%	0.78
כ	2.60%	2.6
ל	7.12%	7.12
ם	2.92%	2.92
מ	4.43%	4.43
ן	1.06%	1.06
נ	2.76%	2.76
ס	1.43%	1.43
ע	3.11%	3.11
ף	0.26%	0.26
פ	1.63%	1.63
ץ	0.12%	0.12
צ	1.20%	1.2
ק	2.06%	2.06
ר	5.40%	5.4
ש	4.25%	4.25
ת	4.84%	4.84

中国語

中国語における文字（漢字）の出現頻度の上位20文字は以下の表の通りである^[123]。分析では2009年にインターネット上で人気のあった8つの小説から計12,379,116文字について調査したものである^[124]。

文字	中国語における相対出現頻度
的	3.47%	3.47
了	2.05%	2.05
一	1.99%	1.99
是	1.67%	1.67
不	1.51%	1.51
这	1.23%	1.23
我	1.16%	1.16
人	1.04%	1.04
在	1.00%	1
地	0.93%	0.93
道	0.92%	0.92
有	0.90%	0.9
他	0.90%	0.9
来	0.87%	0.87
个	0.72%	0.72
说	0.69%	0.69
你	0.69%	0.69
上	0.66%	0.66
大	0.64%	0.64
就	0.59%	0.59

中国の古文書における文字の出現頻度上位10文字は以下の表の通りである^[123]。「不」、「一」、「人」の三文字は各年代において出現頻度が上位10位以内の高い頻度で表れる文字であった^[123]。

年代	順序	詳細
7-10世紀	不人山无风　一日云有何	『全唐詩』に記載されている総数2,602,310文字に対する分析^[124]。
10-13世紀	人风花一不　春无云月天	『全宋詞』に記載されている総数1,417,778文字に対する分析^[124]。
13-14世紀	云我不你的　是人一来了	『元詩選』に記載されている総数2,172,631文字に対する分析^[124]。
14-20世紀	了不一道来　人的是我个	『西遊記』、『水滸伝』、『三国志演義』、『紅楼夢』に記載されている総数2,506,684文字に対する分析^[124]。

また、中国語の拼音（ピンイン）入力におけるアルファベットの出現頻度は以下の表の通りである^[125]。分析には小説から約50万字、新聞記事から約130万字、ネットの投稿から約120万字を抽出したデータを使用している^[126]。⟨i⟩、⟨a⟩、⟨n⟩ の三つの文字の出現頻度が高く、⟨v⟩ が最も出現頻度の低い文字であった^[126]。

文字	中国語の拼音入力における相対出現頻度
A	10.52%	10.52
B	1.42%	1.42
C	1.40%	1.4
D	3.28%	3.28
E	6.97%	6.97
F	0.89%	0.89
G	6.90%	6.9
H	7.17%	7.17
I	13.96%	13.96
J	2.42%	2.42
K	0.65%	0.65
L	1.79%	1.79
M	1.06%	1.06
N	11.91%	11.91
O	5.88%	5.88
P	0.42%	0.42
Q	1.03%	1.03
R	0.92%	0.92
S	2.97%	2.97
T	1.16%	1.16
U	7.94%	7.94
V	0.10%	0.1
W	1.16%	1.16
X	1.92%	1.92
Y	2.92%	2.92
Z	3.26%	3.26

韓国語

韓国語のハングルにおける字母（ハングル字母）の出現頻度は以下の通りとなる^[127]。

順位	字母	位置	度数	割合
5	ㄱ	初声	1,171,038	5.372%	5.372
20	ㄱ	終声	411,538	1.888%	1.888
36	ㄲ	初声	64,997	0.298%	0.298
56	ㄲ	終声	6,068	0.028%	0.028
63	ㄳ	終声	357	0.002%	0.002
16	ㄴ	初声	596,893	2.738%	2.738
4	ㄴ	終声	1,328,090	6.092%	6.092
60	ㄵ	終声	2,790	0.013%	0.013
43	ㄶ	終声	30,376	0.139%	0.139
9	ㄷ	初声	800,785	3.673%	3.673
49	ㄷ	終声	18,535	0.085%	0.085
35	ㄸ	初声	72,604	0.333%	0.333
15	ㄹ	初声	610,211	2.799%	2.799
10	ㄹ	終声	776,891	3.564%	3.564
55	ㄺ	終声	7,330	0.034%	0.034
57	ㄻ	終声	4,344	0.020%	0.02
61	ㄼ	終声	2,183	0.010%	0.01
67	ㄽ	終声	5	0.000%
65	ㄾ	終声	131	0.001%	0.001
66	ㄿ	終声	78	0.000%
59	ㅀ	終声	3,023	0.014%	0.014
18	ㅁ	初声	429,661	1.971%	1.971
24	ㅁ	終声	258,542	1.186%	1.186
23	ㅂ	初声	359,029	1.647%	1.647
29	ㅂ	終声	133,729	0.613%	0.613
52	ㅃ	初声	16,037	0.074%	0.074
46	ㅄ	終声	25,868	0.119%	0.119
11	ㅅ	初声	756,477	3.470%	3.47
30	ㅅ	終声	114,592	0.526%	0.526
44	ㅆ	初声	29,184	0.134%	0.134
25	ㅆ	終声	219,186	1.005%	1.005
1	ㅇ	初声	2,105,587	9.659%	9.659
14	ㅇ	終声	617,205	2.831%	2.831
12	ㅈ	初声	748,509	3.434%	3.434
50	ㅈ	終声	17,173	0.079%	0.079
48	ㅉ	初声	20,434	0.094%	0.094
26	ㅊ	初声	200,266	0.919%	0.919
54	ㅊ	終声	9,944	0.046%	0.046
39	ㅋ	初声	48,097	0.221%	0.221
64	ㅋ	終声	302	0.001%	0.001
31	ㅌ	初声	106,679	0.489%	0.489
47	ㅌ	終声	25,341	0.116%	0.116
33	ㅍ	初声	98,986	0.454%	0.454
51	ㅍ	終声	16,938	0.078%	0.078
13	ㅎ	初声	635,299	2.914%	2.914
45	ㅎ	終声	26,948	0.124%	0.124
2	ㅏ	中声	1,926,007	8.835%	8.835
21	ㅐ	中声	409,768	1.880%	1.88
37	ㅑ	中声	63,728	0.292%	0.292
58	ㅒ	中声	3,769	0.017%	0.017
7	ㅓ	中声	942,819	4.325%	4.325
22	ㅔ	中声	393,695	1.806%	1.806
19	ㅕ	中声	422,490	1.938%	1.938
42	ㅖ	中声	44,394	0.204%	0.204
8	ㅗ	中声	862,073	3.955%	3.955
28	ㅘ	中声	162,656	0.746%	0.746
53	ㅙ	中声	11,215	0.051%	0.051
32	ㅚ	中声	99,794	0.458%	0.458
34	ㅛ	中声	94,576	0.434%	0.434
17	ㅜ	中声	592,419	2.718%	2.718
38	ㅝ	中声	57,373	0.263%	0.263
62	ㅞ	中声	2,035	0.009%	0.009
40	ㅟ	中声	47,506	0.218%	0.218
41	ㅠ	中声	47,135	0.216%	0.216
6	ㅡ	中声	1,151,976	5.285%	5.285
27	ㅢ	中声	179,818	0.825%	0.825
3	ㅣ	中声	1,355,527	6.218%	6.218

韓国語のハングルにおける文字（音節）の出現頻度上位100文字は以下の通りである^[128]。

順位	文字	度数	割合
1	이	314,869	3.550%	3.55
2	다	265,071	2.988%	2.988
3	는	232,384	2.620%	2.62
4	의	172,126	1.940%	1.94
5	에	171,943	1.938%	1.938
6	을	162,579	1.833%	1.833
7	고	152,862	1.723%	1.723
8	가	150,918	1.701%	1.701
9	하	144,051	1.624%	1.624
10	지	133,691	1.507%	1.507
11	로	113,920	1.284%	1.284
12	한	113,150	1.276%	1.276
13	그	108,164	1.219%	1.219
14	은	106,129	1.196%	1.196
15	서	103,121	1.162%	1.162
16	기	102,709	1.158%	1.158
17	어	99,943	1.127%	1.127
18	도	88,314	0.996%	0.996
19	나	86,764	0.978%	0.978
20	를	84,774	0.956%	0.956
21	사	84,247	0.950%	0.95
22	아	80,043	0.902%	0.902
23	리	78,532	0.885%	0.885
24	있	77,858	0.878%	0.878
25	자	75,346	0.849%	0.849
26	들	69,423	0.783%	0.783
27	대	67,855	0.765%	0.765
28	으	66,390	0.748%	0.748
29	인	64,261	0.724%	0.724
30	시	62,338	0.703%	0.703
31	해	60,136	0.678%	0.678
32	라	58,485	0.659%	0.659
33	것	58,386	0.658%	0.658
34	수	58,165	0.656%	0.656
35	니	57,152	0.644%	0.644
36	게	56,945	0.642%	0.642
37	정	54,407	0.613%	0.613
38	보	49,019	0.553%	0.553
39	일	45,932	0.518%	0.518
40	적	45,475	0.513%	0.513
41	만	44,672	0.504%	0.504
42	부	43,880	0.495%	0.495
43	주	43,879	0.495%	0.495
44	과	43,685	0.492%	0.492
45	제	43,631	0.492%	0.492
46	면	42,568	0.480%	0.48
47	었	40,355	0.455%	0.455
48	전	39,553	0.446%	0.446
49	여	39,529	0.446%	0.446
50	상	39,345	0.444%	0.444
51	장	37,885	0.427%	0.427
52	요	37,391	0.422%	0.422
53	구	36,967	0.417%	0.417
54	문	34,109	0.385%	0.385
55	내	33,964	0.383%	0.383
56	우	33,145	0.374%	0.374
57	성	31,692	0.357%	0.357
58	거	31,282	0.353%	0.353
59	동	31,041	0.350%	0.35
60	생	30,364	0.342%	0.342
61	되	30,317	0.342%	0.342
62	마	30,184	0.340%	0.34
63	러	30,051	0.339%	0.339
64	국	29,241	0.330%	0.33
65	소	29,105	0.328%	0.328
66	화	29,068	0.328%	0.328
67	신	28,918	0.326%	0.326
68	무	28,660	0.323%	0.323
69	했	28,176	0.318%	0.318
70	원	27,582	0.311%	0.311
71	스	26,804	0.302%	0.302
72	오	26,341	0.297%	0.297
73	야	26,009	0.293%	0.293
74	위	25,964	0.293%	0.293
75	경	25,932	0.292%	0.292
76	말	25,618	0.289%	0.289
77	와	25,168	0.284%	0.284
78	조	25,055	0.282%	0.282
79	없	24,975	0.282%	0.282
80	모	24,764	0.279%	0.279
81	데	24,512	0.276%	0.276
82	비	24,266	0.274%	0.274
83	할	23,706	0.267%	0.267
84	계	23,653	0.267%	0.267
85	안	23,152	0.261%	0.261
86	까	23,016	0.259%	0.259
87	중	22,916	0.258%	0.258
88	세	22,764	0.257%	0.257
89	때	22,618	0.255%	0.255
90	미	22,373	0.252%	0.252
91	려	22,040	0.248%	0.248
92	회	22,033	0.248%	0.248
93	학	21,990	0.248%	0.248
94	관	21,976	0.248%	0.248
95	선	21,973	0.248%	0.248
96	간	21,939	0.247%	0.247
97	치	21,910	0.247%	0.247
98	진	21,719	0.245%	0.245
99	공	21,307	0.240%	0.24
100	실	21,280	0.240%	0.24

また、1950年代に調査された韓国の文書中におけるハングルの出現頻度の高い30文字は 이는다하 에가고올지어 의은서그아 로라기도한 나니를것있 리으여사들 の順である^[129]。また、1950年代に調査された韓国語の文書中における漢字の出現頻度の高い30文字は 國生地人自十一分物年學大字發身民氣方間會日事對行上當實等二法 である^[130]。

台湾語

以下の表では台湾語における出現頻度の高い音節上位20文字を記載する^[131]^[132]。なお、台湾語は文字の表記法として主に漢字（全漢）、漢字ローマ字混用（漢羅）、ローマ字（全羅）の三つ存在しているため、以下の表では漢字およびローマ字が混合した出現頻度となっている^[133]。

文字	台湾語における相対出現頻度
ê	4.2252%	4.2252
是	1.8029%	1.8029
人	1.3831%	1.3831
(数字)	1.2566%	1.2566
有	1.2495%	1.2495
無	1.0347%	1.0347
來	1.0218%	1.0218
我	0.9500%	0.95
一	0.9415%	0.9415
講	0.9312%	0.9312
伊	0.9055%	0.9055
tī	0.7983%	0.7983
會	0.7355%	0.7355
去	0.6659%	0.6659
著	0.6157%	0.6157
m̄	0.6023%	0.6023
個	0.5901%	0.5901
就	0.5896%	0.5896
台	0.5429%	0.5429
真	0.5375%	0.5375

アムハラ語

アムハラ語で使用されるゲエズ文字（アムハラ文字）における文字の出現頻度は以下の表の通りである^[134]。分析に使用したデータの文字の総数は 12,222,876文字である^[134]。

文字	アムハラ語における相対出現頻度
ሀ	2.28%	2.28
ለ	7.62%	7.62
ሐ	0.62%	0.62
መ	8.45%	8.45
ሠ	0.69%	0.69
ረ	6.68%	6.68
ሰ	4.73%	4.73
ሸ	0.57%	0.57
ቀ	2.42%	2.42
በ	6.77%	6.77
ቨ	0.08%	0.08
ተ	7.96%	7.96
ቸ	2.59%	2.59
ኀ	0.28%	0.28
ነ	9.58%	9.58
ኘ	0.78%	0.78
አ	5.09%	5.09
ከ	3.29%	3.29
ኸ	0.07%	0.07
ወ	5.16%	5.16
ዐ	0.73%	0.73
ዘ	1.79%	1.79
ዠ	0.05%	0.05
የ	7.54%	7.54
ደ	4.10%	4.1
ጀ	0.72%	0.72
ገ	4.03%	4.03
ጠ	2.08%	2.08
ጨ	0.47%	0.47
ጰ	0.18%	0.18
ጸ	0.39%	0.39
ፀ	0.20%	0.2
ፈ	1.71%	1.71
ፐ	0.31%	0.31

ゴート語

現在は死語となっているゴート語のゴート文字における文字の出現頻度は以下の表の通りである^[135]。

文字	ゴート語における相対出現頻度
𐌰	19.49%	19.49
𐌱	1.53%	1.53
𐌲	2.64%	2.64
𐌳	3.73%	3.73
𐌴	3.92%	3.92
𐌵	0.56%	0.56
𐌶	0.78%	0.78
𐌷	3.07%	3.07
𐌸	4.94%	4.94
𐌹	13.97%	13.97
𐌺	1.43%	1.43
𐌻	2.43%	2.43
𐌼	3.70%	3.7
𐌽	8.97%	8.97
𐌾	3.00%	3
𐌿	5.70%	5.7
𐍀	0.30%	0.3
𐍁	0.001%	0.001
𐍂	3.02%	3.02
𐍃	7.66%	7.66
𐍄	2.88%	2.88
𐍅	2.46%	2.46
𐍆	1.46%	1.46
𐍇	0.12%	0.12
𐍈	0.43%	0.43
𐍉	1.80%	1.8
𐍊	0.0005%	0.0005

参考文献

문교부 (1955) (朝鮮語). 우리말에 쓰힌 글자의 잦기 조사. 문교부. CRID 1130000795562943232. NCID BA60453823
Lewand, Robert (2000) (英語). Cryptological Mathematics. Mathematical Association of America. p. 36. CRID 1130000796292757504. ISBN 978-0883857199. NCID BA51307547. OCLC 45467783
김한샘 (2005). 국립국어원. ed (朝鮮語). 현대 국어 사용 빈도 조사. 국립국어원. CRID 1130282269329416576. NCID BA79423555. OCLC 181103258
安岡孝一、安岡素子『文字符号の歴史: 欧米と日本編』共立出版、2006年。 CRID 1130000794361641472。 ISBN 978-4320121027。 NCID BA77209215。 OCLC 675262690。
計量国語学会編『計量国語学事典』（初版）朝倉書店、2009年。 CRID 1130282269066071808。 ISBN 978-4-254-51035-5。 NCID BB00298038。 OCLC 676049130。
Christopher D.Manning、Hinrich Schütze 著、加藤恒昭、菊井玄一郎、林良彦、森辰則訳『統計的自然言語処理の基礎』共立出版、2017年。 CRID 1130282271995630336。 ISBN 9784320124219。 NCID BB24924209。 OCLC 1014231220。
浜田悦生著、狩野裕編『データサイエンスの基礎』講談社サイエンティフィク〈データサイエンス入門〉、2019年。 CRID 1130282268665000704。 ISBN 978-4-06-517000-7。 NCID BB28803192。 OCLC 1124280281。
村山登 (1981). 日本文事務文書における字種の解析と応用 (PDF) (Technical report). RICOH TECHNICAL REPORT. pp. 4–12. CRID 1130282268569845376. ISSN 0387-7795. NCID AN00027966. OCLC 1030177755. 6. 2025年3月29日時点のオリジナル (PDF)よりアーカイブ. 2025年3月29日閲覧.
石井久雄「雑誌における語の長さ」『計量国語学』第17巻第4号、計量国語学会、1990年、193-206頁、 CRID 1520853832666737152、 ISSN 04534611、 NAID 40000975040、 NCID AN00073067。
Nobuko Chikamatsu; Shoichi Yokoyama; Hironari Nozaki; Eric Long; Sachio Fukuda (2000). “A Japanese logographic character frequency list for cognitive science research” (英語). Behavior Research Methods Instruments & Computers (Psychonomic Society) 32 (2): 482-500. CRID 1363388845516016768. doi:10.3758/BF03200819. ISSN 0743-3808. OCLC 809193935. PMID 11029823. オリジナルの2025-03-09時点におけるアーカイブ。.
Robert M. Schindler (2009). “Patterns of price endings used in US and Japanese price advertising” (英語). International Marketing Review (Emerald Group Publishing) 26 (1): 17-29. CRID 1130000793564073728. doi:10.1108/02651330910933186. ISSN 0265-1335. NCID AA12852954. LCCN 88-659225. OCLC 48650607.
Qinghua Chen; Jinzhong Guo; Yufan Liu (2012). “A Statistical Study on Chinese Word and Character Usage in Literatures from the Tang Dynasty to the Present” (英語). Journal of Quantitative Linguistics (Taylor & Francis) 19 (3): 232-248. CRID 1130000793555067776. doi:10.1080/09296174.2012.685305. ISSN 0929-6174. NCID AA11023262. LCCN 95-32941. OCLC 42679044. CODEN JQLIEO.
Gintautas Grigas; Anita Juškevičienė (2018). “Letter Frequency Analysis of Languages Using Latin Alphabet” (英語). International Linguistics Research (IDEAS SPREAD Publisher) 1 (1): 18-31. doi:10.30560/ilr.v1n1p18. ISSN 2576-2974. オリジナルの2024-07-26時点におけるアーカイブ。.
Rasha Hassan Abbas; Firas Abdul Elah Abdul Kareem (2019). “Text Language Identification Using Letters (Frequency, Self-information, and Entropy) Analysis for English, French, and German Languages” (英語). Journal of Southwest Jiaotong University (西南交通大学) 54 (4): 1-12. CRID 1130000793633411968. doi:10.35741/issn.0258-2724.54.4.21. ISSN 0258-2724. NCID AN10201527. OCLC 858620766.
Jennifer Golbeck (2023). “Benford’s Law applies to word frequency rank in English, German, French, Spanish, and Italian” (英語). PLoS ONE (Public Library of Science) 18 (9): e0291337. doi:10.1371/journal.pone.0291337. PMID 37708112.
『漢字出現頻度数調査（４）（令和４年２月文化庁国語課）』（レポート）文化庁国語課、2022年11月29日。2025年3月25日閲覧。漢字出現頻度数調査（４）（令和４年２月文化庁国語課） - ウェイバックマシン（2025年1月6日アーカイブ分）
“Frequency Analysis in Light of Language Innovation” (英語). カリフォルニア大学サンディエゴ校 (2005年春). 2025年1月27日時点のオリジナルよりアーカイブ。2015年2月19日閲覧。

外部リンク

Lewand, Robert Edward. “Cryptographical Mathematics” (英語). pages.central.edu. 2007年4月2日時点のオリジナルよりアーカイブ。2025年3月15日閲覧。
“Some examples of letter frequency rankings in some common languages” (英語). www.bckelk.org.uk. 2024年9月6日時点のオリジナルよりアーカイブ。2025年3月15日閲覧。
“JavaScript Heatmap Visualization showing letter frequencies of texts on different keyboard layouts” (英語). www.patrick-wied.at. 2025年3月11日時点のオリジナルよりアーカイブ。2025年3月15日閲覧。
Norvig, Peter. “An updated version of Mayzner's work using Google books Ngrams data set” (英語). norvig.com. 2025年3月8日時点のオリジナルよりアーカイブ。2025年3月15日閲覧。
“Letter frequency” (英語). simia.net (2012年11月4日). 2024年11月18日時点のオリジナルよりアーカイブ。2025年3月17日閲覧。

便利な表

以下の文献は英単語の3から7文字目までの文字の位置や単語の長さを考慮した20,000単語中の単文字、連接文字、3文字、4文字、5文字の出現頻度をまとめた表が記載されている:

Mayzner, M.S.; Tresselt, M.E.; Wolin, B.R. (1965). “Tables of single-letter and digram frequency counts for various word-length and letter-position combinations” (英語). Psychonomic Monograph Supplements 1 (2): 13–32. CRID 1572261549913497600. NAID 10029468810. OCLC 639975358.
Mayzner, M.S.; Tresselt, M.E.; Wolin, B.R. (1965). “Tables of trigram frequency counts for various word-length and letter-position combinations” (英語). Psychonomic Monograph Supplements 1 (3): 33–78.
Mayzner, M.S.; Tresselt, M.E.; Wolin, B.R. (1965). “Tables of tetragram frequency counts for various word-length and letter-position combinations” (英語). Psychonomic Monograph Supplements 1 (4): 79–143.
Mayzner, M.S.; Tresselt, M.E.; Wolin, B.R. (1965). “Tables of pentagram frequency counts for various word-length and letter-position combinations” (英語). Psychonomic Monograph Supplements 1 (5): 144–190.

[Al-Kindi-1] “Al-Kindi Writes the First Treatise on Cryptanalysis” (英語). 2024年3月31日時点のオリジナルよりアーカイブ。2025年3月31日閲覧。

[movable-1450-2] Fred Williams (1992年). “Origin of the California Job Case” (英語). 2021年4月16日時点のオリジナルよりアーカイブ。2025年5月6日閲覧。

[FOOTNOTE計量国語学会200945-3] 計量国語学会 2009, p. 45.

[4] Guinness, Harry. “The Best Starting Words to Win at Wordle” (英語). Wired. CRID 1130000793632212736. ISSN 1059-1028. NCID AA1103877X. LCCN 94-659076. OCLC 1519781539. CODEN WREDEM. オリジナルの2025-02-23時点におけるアーカイブ。 2022年2月12日閲覧。.

[5] Samantha Graves (2024年11月25日). “Which 'Wheel of Fortune' Bonus Round Letter Picks Are Best?” (英語). collider. オリジナルの2025年3月28日時点におけるアーカイブ。 2025年3月28日閲覧。

[6] 一松信『暗号の数理 : 作り方と解読の原理』講談社〈ブルーバックス B-1490〉、2005年、78-79頁。 CRID 1130282272011986688。 ISBN 406257490X。 NCID BA73456438。 OCLC 674952160。

[7] 藤原融「暗号について」『大阪大学大型計算機センターニュース』第67巻、大阪大学、1987年、43-49頁、 CRID 1130282268550183296、 hdl:11094/65759、 ISSN 0910-0164、 NCID AN00029994、 OCLC 852213694、オリジナルの2024年9月7日時点におけるアーカイブ。

[8] Zim, Herbert Spencer (1961) (英語). Codes & Secret Writing: Authorized Abridgement. Scholastic Book Services. OCLC 317853773

[9] Prashant Kumar (2017). “Optimization of Key Frequency in Keyboard Using Mathematical inclusion of Design” (英語). International Journal of Advance Research and Innovative Ideas in Education (IJARIIE) 3 (5): 177-183. ISSN 2395-4396. OCLC 913056193. オリジナルの2024-07-14時点におけるアーカイブ。.

[10] Valdis Vitolins (2017). “Modernized Latvian Ergonomic Keyboard” (英語). arXiv:1707.03753 [cs.HC].

[11] “The California job case” (英語). briarpress.org. One Art Design. 2024年11月13日時点のオリジナルよりアーカイブ。2025年3月29日閲覧。

[12] Singh, Simon (2000) (英語). The Code Book. Anchor Books. pp. 14–20. CRID 1130000793788208128. ISBN 0-385-49532-3. NCID BA68183019. OCLC 59459928

[FOOTNOTEAbbas20193-13] Abbas 2019, p. 3.

[FOOTNOTEMarsha_Lynn200513-14] Marsha Lynn 2005, p. 13.

[FOOTNOTEMarsha_Lynn200511-15] Marsha Lynn 2005, p. 11.

[FOOTNOTEMarsha_Lynn200513,_20-16] Marsha Lynn 2005, pp. 13, 20.

[17] Randall Noon, K. (2010). “The Long and Short of It: CW Is Really Clever Stuff” (PDF). WorldRadio Online (英語). Vol. 40, no. 6. CQ Communications. p. 40. 2024年9月9日時点のオリジナル (PDF)よりアーカイブ. 2025年4月3日閲覧.

[18] Ovidiu Calin (2020). “Statistics and Machine Learning Experiments in English and Romanian Poetry” (英語). Sci (MDPI) 2 (4): 2. doi:10.3390/sci2040092. ISSN 2413-4155. OCLC 1232529923 2025年4月22日閲覧。.

[FOOTNOTE安岡200617–18-19] 安岡 2006, pp. 17–18.

[20] Kahn, David (1967) (英語). The codebreakers : the story of secret writing. Macmillan. pp. 741-742. CRID 1130282270626959616. ISBN 0025604600. NCID BA1728674X. LCCN 63-16109. OCLC 717303

[FOOTNOTE安岡200637-22] 安岡 2006, p. 37.

[23] 田中哲朗「ハフマン符号を解く」『情報処理』第44巻第7号、情報処理学会、2003年、755-762頁、 CRID 1130000793592043264、 ISSN 0447-8053、 NCID AN00116625、 OCLC 834281607、オリジナルの2022年5月17日時点におけるアーカイブ、2025年4月3日閲覧。

[FOOTNOTE計量国語学会2009238–239-24] 計量国語学会 2009, pp. 238–239.

[25] Camilla Nelson (2016年5月31日). “Getting tense (about tense in fiction)” (英語). The Conversation. 2024年7月19日時点のオリジナルよりアーカイブ。2025年7月1日閲覧。

[26] Thomas Merriam (1994). “Letter frequency as a discriminator of authors” (英語). Notes and Queries (Oxford University Press) 41 (4): 467-469. CRID 1130000793592940416. doi:10.1093/NQ/41-4-467. ISSN 0029-3970. NCID AA00315051. OCLC 2623018.

[27] 福岡祐一『近代日本語小説の著者判別技術に関する検討』（修士（工学）論文・情報科学研究科情報処理学専攻専攻）奈良先端科学技術大学院大学、2007年、3-4頁。学位記番号: 修第3496号。

[FOOTNOTE計量国語学会2009238–248-28] 計量国語学会 2009, pp. 238–248.

[FOOTNOTELewend200037-29] Lewend 2000, p. 37.

[30] “British and American spelling - Oxford Dictionaries” (英語). Oxford Dictionaries - English. 2011年12月28日時点のオリジナルよりアーカイブ。2018年4月18日閲覧。

[31] Shundalyn Allen (2022年9月23日). “What’s the Rarest Letter of the Alphabet?” (英語). Grammarly. 2025年5月18日時点のオリジナルよりアーカイブ。2025年7月1日閲覧。

[32] “Letter Frequencies” (英語). 2025年3月16日時点のオリジナルよりアーカイブ。2025年5月7日閲覧。

[33] Li, Wentian; Miramontes, Pedro (2011). “Fitting ranked English and Spanish letter frequency distribution in US and Mexican presidential speeches” (英語). Journal of Quantitative Linguistics 18 (4): 359. arXiv:1103.2950. doi:10.1080/09296174.2011.608606. オリジナルの2025-07-27時点におけるアーカイブ。 2025年3月29日閲覧。.

[34] Gamow, George; Ycas, Martynas (1955). “Statistical correlation of protein and ribonucleic acid composition” (英語). Proc. Natl. Acad. Sci. 41 (12): 1011–1019. Bibcode: 1955PNAS...41.1011G. doi:10.1073/pnas.41.12.1011. JSTOR 89096. PMC 528190. PMID 16589789.

[35] Gusein-Zade, S.M. (1988). “Frequency distribution of letters in the Russian language” (ロシア語). Problemy Peredachi Informatsii (Izd-vo "Nauka") 24 (4): 102–107. CRID 1130282268585569024. ISSN 0555-2923. NCID AA00009408. LCCN 68-40359. OCLC 5696571. CODEN PPDIA5.

[36] Bauer, Friedrich L. (2006) (英語). Decrypted Secrets: Methods and maxims of cryptology. Springer. p. 57. doi:10.1007/978-3-540-48121-8. ISBN 9783540481218. OCLC 990533529

[37] Goebel, Greg (2009) (英語). The Rise Of Field Ciphers: straddling checkerboard ciphers. オリジナルの2005年12月5日時点におけるアーカイブ。

[38] Rijmenants, Dirk. “One-time Pad” (英語). 2025年3月8日時点のオリジナルよりアーカイブ。2025年3月16日閲覧。

[FOOTNOTEChikamatsu2000499-39] Chikamatsu 2000, p. 499.

[nozaki1996-40] 野崎浩成、横山詔一、磯本征雄、米田純子「文字使用に関する計量的研究 : 日本語教育支援の観点から」『日本教育工学雑誌』第20巻第3号、日本教育工学会、1996年、141-149頁、 CRID 1390001204489626880、doi:10.15077/jmet.20.3_141、 ISSN 0385-5236、 NAID 110003026289、 NCID AN00368220、オリジナルの2020年12月12日時点におけるアーカイブ、2025年5月8日閲覧。

[FOOTNOTEChikamatsu2000500-41] Chikamatsu 2000, p. 500.

[FOOTNOTE文化庁20228-42] 文化庁 2022, p. 8.

[FOOTNOTE文化庁20222-43] 文化庁 2022, p. 2.

[FOOTNOTE文化庁20228–9-44] 文化庁 2022, pp. 8–9.

[FOOTNOTEChikamatsu2000484–485-45] Chikamatsu 2000, pp. 484–485.

[FOOTNOTE計量国語学会200947–48-46] 計量国語学会 2009, pp. 47–48.

[FOOTNOTE村山19815–6-47] 村山 1981, pp. 5–6.

[48] 野崎浩成、清水康敬「新聞における漢字頻度特性の分析とNIEのための漢字学習表の開発」『日本教育工学雑誌』第24巻第2号、日本教育工学会、2000年、121-132頁、 CRID 1390001204488401152、doi:10.15077/jmet.24.2_121、 ISSN 0385-5236、 NAID 110003026392、 NCID AN00368220、オリジナルの2024年9月5日時点におけるアーカイブ、2025年6月11日閲覧。

[FOOTNOTELewend200036-49] Lewend 2000, p. 36.

[50] “English letter frequencies” (英語). 2008年7月8日時点のオリジナルよりアーカイブ。2008年6月25日閲覧。

[oxford_dictionary-51] “What is the frequency of the letters of the alphabet in English?” (英語). Oxford Dictionary. オックスフォード大学出版局. 2011年12月24日時点のオリジナルよりアーカイブ。2012年12月29日閲覧。

[52] Mička, Pavel. “Letter frequency (English)” (チェコ語). Algoritmy.net. 2024年8月3日時点のオリジナルよりアーカイブ。2025年3月17日閲覧。

[53] “English Letter Frequency (based on a sample of 40,000 words)” (英語). cornell.edu. 2025年1月1日時点のオリジナルよりアーカイブ。2021年1月24日閲覧。

[54] “Statistical Distributions of English Text” (英語). data-compression.com. 2017年9月18日時点のオリジナルよりアーカイブ。2025年3月16日閲覧。

[55] Lee, E. Stewart (1999年). “Essays about Computer Security” (英語). University of Cambridge Computer Laboratory. p. 181. 2024年5月15日時点のオリジナルよりアーカイブ。2025年3月15日閲覧。

[56] Robert L. Solso; Connie Juel; David C. Rubin (1982). “The frequency and versatility of initial and terminal letters in English words” (英語). Journal of Verbal Learning and Verbal Behavior (Academic Press) 21 (2): 220-235. CRID 1130000793634841472. doi:10.1016/S0022-5371(82)90581-3. ISSN 0022-5371. NCID AA00245772. LCCN 66-93737. OCLC 1783224. CODEN JVLBAY. オリジナルの2024-04-15時点におけるアーカイブ。 2025年5月8日閲覧。.

[ohlman-57] Ohlman, Herbert Marvin (1959) (英語). Subject-Word Letter Frequencies with Applications to Superimposed Coding. Proceedings of the International Conference on Scientific Information. doi:10.17226/10866. ISBN 978-0-309-57421-1. OCLC 56212934

[58] “Cutter Classification” (英語). forbes library. 2025年3月28日時点のオリジナルよりアーカイブ。2025年3月28日閲覧。

[pande-59] Pande, Hemlata; Dhami, H.S. (2010). “Mathematical Modelling of Occurrence of Letters and Word's Initials in Texts of Hindi Language” (英語). JTL (The Slovak Association for the Study of English) 7 (2). ISSN 1336-782X. OCLC 181077698.

[FOOTNOTEGolbeck20231–3-60] Golbeck 2023, pp. 1–3.

[61] “English Letter Frequency Counts: Mayzner revisited or ETAOIN SRHLDCU” (英語). norvig.com. 2025年3月16日時点のオリジナルよりアーカイブ。2018年4月18日閲覧。

[FOOTNOTEGrigas201821–22-62] Grigas 2018, pp. 21–22.

[63] “Corpus de Thomas Tempé” (フランス語). 2007年9月30日時点のオリジナルよりアーカイブ。2007年6月15日閲覧。

[64] Beutelspacher, Albrecht (2005). Kryptologie eine Einführung in die Wissenschaft vom Verschlüsseln, Verbergen und. Studium (7 ed.). Wiesbaden: Vieweg. p. 10. ISBN 3-8348-0014-7. OCLC 76768974

[65] Pratt, Fletcher (1942) (英語). Secret and Urgent: The story of codes and ciphers. Garden City, NY: Blue Ribbon Books. pp. 254–5. ASIN B0007DRU3A. OCLC 795065

[66] “Frequência da ocorrência de letras no Português” (ポルトガル語). 2009年8月3日時点のオリジナルよりアーカイブ。2009年6月16日閲覧。

[67] Singh, Simon; Galli, Stefano (1999) (イタリア語). Codici e Segreti. Milano: Rizzoli. ISBN 978-8-817-86213-4. OCLC 535461359

[68] Serengil, Sefik Ilkin; Akin, Murat (20 February 2011). Attacking Turkish Texts Encrypted by Homophonic Cipher (PDF). Proceedings of the 10th WSEAS International Conference on Electronics, Hardware, Wireless and Optical Communications (英語). Cambridge, UK. pp. 123–126. ISBN 978-960-474-276-9. 2023年3月21日時点のオリジナル (PDF)よりアーカイブ.

[69] “Practical Cryptography” (英語). 2025年1月18日時点のオリジナルよりアーカイブ。2013年10月30日閲覧。

[70] “Frekwencja liter w polskich tekstach - Poradnia językowa PWN” (ポーランド語). 2024年9月11日時点のオリジナルよりアーカイブ。2025年3月15日閲覧。

[OnzeTaal-71] “Letterfrequenties” (オランダ語). Genootschap OnzeTaal. 2024年4月20日時点のオリジナルよりアーカイブ。2009年5月17日閲覧。

[72] “Danish letter frequencies” (英語). Practical Cryptography. 2024年8月7日時点のオリジナルよりアーカイブ。2013年10月24日閲覧。

[73] “Icelandic letter frequencies” (英語). Practical Cryptography. 2024年9月10日時点のオリジナルよりアーカイブ。2013年10月24日閲覧。

[74] “Finnish letter frequencies” (英語). Practical Cryptography. 2025年1月18日時点のオリジナルよりアーカイブ。2013年10月24日閲覧。

[75] “Statistika českých grafémů s využitím moderní výpočetní techniky” (チェコ語). Slovo a slovesnost (Czech Language Institute, Czech Academy of Sciences) 44 (4): 295–304. (1983). CRID 1130000793641851776. ISSN 0037-7031. NCID AA00411893. LCCN 53-38941. OCLC 1935810 2025年3月25日閲覧。.

[76] “Hungarian character frequencies”. Wolfram Alpha. 2023年3月25日閲覧。

[77] “I made some software…” (英語) (2023年4月27日). 2025年3月15日閲覧。

[78] Grigas, Gintautas; Juškevičienė, Anita (2015-12-28). “Letter Frequency Analysis of Lithuanian and Other Languages Using the Latin Alphabet” (リトアニア語). Coactivity: Philology, Educology / Santalka: Filologija, Edukologija (ヴィリニュス・ゲディミナス工科大学) 23 (2): 81–91. doi:10.3846/cpe.2015.271. ISSN 2335-7711. OCLC 1048191509. オリジナルの2019-04-30時点におけるアーカイブ。 2022年2月2日閲覧。.

[79] Jakopin, Primož (1999). Zgornja meja entropije pri leposlovnih besedilih v slovenskem jeziku (Ph.D. thesis) (スロベニア語). Ljubljana: リュブリャナ大学, Fakulteta za elektrotehniko. COBISS 12801837. 2006年9月5日時点のオリジナルよりアーカイブ. 2006年8月10日閲覧.

[80] 3.Д.Усманов; C.Ёкубзода (2006). “О СТАТИСТИЧЕСКИХ ЗАКОНОМЕРНОСТЯХ ЯЗЫКА ЭСПЕРАНТО” (ロシア語). ДОКЛАДЫ АКАДЕМИИ НАУК РЕСПУБЛИКИ ТАДЖИКИСТАН (Президиум Академии наук Республики Таджикистан) 49 (4): 316—320. CRID 1130282268506077952. ISSN 0002-3469. NCID AA00003194. LCCN 57-36408. OCLC 5725541. CODEN DANTAL.

[81] Dorin Afanas; Alexandrina Gorceag; Andrei Şestacov (2019). Metodologia spargerii sistemelor monoalfabetice de criptare. Materialele Conferinței Republicane a Cadrelor Didactice (ルーマニア語). Vol. 1. pp. 159–167. ISBN 978-9975-76-271-7.

[Shah-2013-82] Asadullah Shah; Aznan Zuhid Saidin; Imad Fakhri Taha; Akram M. Zeki; Zeeshan Bhatti (2013). Similarities and Dissimilarities between Character Frequencies of Written Text of Melayu, English, and Indonesian Languages. International Conference on Advanced Computer Science Applications and Technologies (英語). IEEE. pp. 192–194. doi:10.1109/ACSAT.2013.45. ISBN 978-1-4799-2758-6.

[FOOTNOTEGrigas201818-83] Grigas 2018, p. 18.

[84] Perec, Georges (1976) (フランス語). Alphabets : cent soixante-seize onzains hétérogrammatiques. Éditions Galilée. CRID 1130282269477356544. ISBN 2-7186-0051-9. NCID BA25161091. LCCN 77-465787. OCLC 3166564

[86] “Welke letters worden in het Nederlands het meest gebruikt?” (オランダ語). Genootschap OnzeTaal. 2024年4月20日時点のオリジナルよりアーカイブ。2008年12月26日閲覧。

[Stefan_russian-87] Stefan Trost. “Stefan Trost's website: Russian”. Stefan Trost Media. 2024年11月11日時点のオリジナルよりアーカイブ。2025年3月22日閲覧。

[88] Aleksandra Mileva; Stojanče Panov; Vesna Dimitrova (2012). “Frequency Distribution of Letters, Bigrams and Trigrams in the Macedonian language” (英語). Yearbook-Faculty of Computer Science (Goce Delčev University of Štip) 1 (1): 149-160. オリジナルの2024-06-09時点におけるアーカイブ。 2025年5月20日閲覧。.

[89] Усманов З. Д.; Косимов А. А. (2015). “Частотность букв таджикской литературы” (ロシア語). Доклады Академии наук Республики Таджикистан (Президиум Академии наук Республики Таджикистан) 58 (2): 112—115. CRID 1130282268506077952. ISSN 0002-3469. NCID AA00003194. LCCN 57-36408. OCLC 5725541. CODEN DANTAL.

[90] Косимов А. А. (2015-11-24). “Басомади такроршавии ҳарфҳои адабиёти тоҷик ” (タジク語). Маҷаллаи «Шафақ» (Нашрияи Кумиҷроияи Ҳизби Халқии Демократии Тоҷикистон дар шаҳри Хуҷанд) (21): 2.

[91] Елена Александровна Архипова; Владамир Николаевич Журавлев (2009). “Частотний аналіз використання букв української мови” (ウクライナ語). Радіоелектроніка, інформатика, управління (Запорожский национальный технический университет) 2 (1): 53-56. ISSN 1607-3274. OCLC 888588371.

[92] Асқар Жұбанов; Айман Жаңабекова (2020). “ҚАЗАҚ ӘЛІПБИІ: ПЕРНЕТАҚТАДА ОРНАЛАСТЫРУДЫҢ СТАТИСТИКАЛЫҚ НЕГІЗДЕРІ” (カザフ語). ЛАТЫН ӘЛІПБИІ: ТАЛҚЫ, ХАЛЫҚАРАЛЫҚ ТӘЖІРИБЕ ЖӘНЕ НӘТИЖЕ. Қазақстан Республикасы Мәдениет және спорт министрлігі Тіл саясаты комитеті. pp. 15-16. ISBN 978-601-7504-46-5

[93] Вукашин Бабић (2024). “УЧЕСТАЛОСТ МАЛИХ И ВЕЛИКИХ СЛОВА, БИГРАМА И ТРИГРАМА У СРПСКОМ ЈЕЗИКУ” (セルビア語). ИнфоМ (Факултет организационих наука Универзитета у Београду) (79-80): 22-26. ISSN 1451-4397. OCLC 1360446500.

[94] З.Д.Усманов; А.Г.Гуломсафдаров (2009). “СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ ЧАСТОТ ВСТРЕЧАЕМОСТИ БУКВ В ШУГНАНСКОМ ЯЗЫКЕ” (ロシア語). ДОКЛАДЫ АКАДЕМИИ НАУК РЕСПУБЛИКИ ТАДЖИКИСТАН (Президиум Академии наук Республики Таджикистан) 52 (3): 187—191. CRID 1130282268506077952. ISSN 0002-3469. NCID AA00003194. LCCN 57-36408. OCLC 5725541. CODEN DANTAL.

[95] З.Д.Усманов; Н.У.Кадамшоев (2009). “СТАТИСТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ ЧАСТОТ ВСТРЕЧАЕМОСТИ БУКВ В РУШАНСКОМ ЯЗЫКЕ” (ロシア語). ДОКЛАДЫ АКАДЕМИИ НАУК РЕСПУБЛИКИ ТАДЖИКИСТАН (Президиум Академии наук Республики Таджикистан) 52 (2): 106—110. CRID 1130282268506077952. ISSN 0002-3469. NCID AA00003194. LCCN 57-36408. OCLC 5725541. CODEN DANTAL.

[96] З.Д.Усманов; Ш.А.Шарипов (2006). “О СТАТИСТИЧЕСКИХ ИНВАРИАНТАХ УЗБЕКСКОГО ЛИТЕРАТУРНОГО ЯЗЫКА” (ロシア語). ДОКЛАДЫ АКАДЕМИИ НАУК РЕСПУБЛИКИ ТАДЖИКИСТАН (Президиум Академии наук Республики Таджикистан) 49 (1): 10—14. CRID 1130282268506077952. ISSN 0002-3469. NCID AA00003194. LCCN 57-36408. OCLC 5725541. CODEN DANTAL.

[97] Tihomir Trifonov; Tsvetanka Georgieva-Trifonova (2012). “Research on Letter and Word Frequency in the Modern Bulgarian Language” (英語). International Journal of Knowledge-Based Organizations (IGI Global Scientific Publishing) 2 (3): 74-90. doi:10.4018/ijkbo.2012070105. ISSN 2155-6393. OCLC 4899498524.

[98] Ч. Алтангэрэл; М. Энхжаргал (2013). “ЦАХИМ БИЧВЭРТ СУУРИЛСАН МОНГОЛ ХЭЛНИЙ ҮЕИЙН ДАВТАМЖИЙН СУДАЛГАА” (モンゴル語). Монгол судлал (Монгол Судлалын Сургууль, Монгол Улсын Их Сургууль) 36 (386): 1-10. CRID 1130282268521074560. ISSN 1997-1826. NCID AA12442817. LCCN 00-320869.

[99] M. V. Shul'meister; G. A. Tal' (1981) (ロシア語). Справочник технолога-полиграфиста. Книга. p. 94. CRID 1130282271839292544. NCID BA57594485. OCLC 59524858

[100] “Список частотности букв татарского языка”. corpus.tatar. 2016年8月11日時点のオリジナルよりアーカイブ。2025年7月4日閲覧。

[101] Баячорова, Б. Ж.; Ж. Батыров. (2019). “Компьютерный анализ частотности букв в кыргызском тексте” (ロシア語). Вестник Кыргызского Национального Университета имени Жусупа Баласагына (Кыргызского Национального Университета) (S1): 94-96. ISSN 1694-5344.

[Arabic-102] “A study of Arabic letter frequency analysis” (英語). 2025年3月17日時点のオリジナルよりアーカイブ。2025年4月26日閲覧。

[103] 艾尼瓦尔麦麦提; 吐尔根依布拉音 (2004). 维吾尔文字字母频率统计及其应用 (PDF). 第二届全国学生计算语言学研讨会论文集 (中国語). 中国中文信息学会计算语言学专业委员会. pp. 490–493. 2025年6月24日時点のオリジナル (PDF)よりアーカイブ. 2025年6月23日閲覧.

[104] Aniwaer Tuergn.Yibulayin (2005). Uighur alphabetic statistics and application. International Conference on Natural Language Processing and Knowledge Engineering (英語). IEEE. p. 377. CRID 1130282268973342080. doi:10.1109/NLPKE.2005.1598765. ISBN 0-7803-9361-9. NCID BA77582751. OCLC 69646661.

[105] منصوری; مهرزاد (2012). “بررسی بسامد نویسه های زبان فارسی و مناسبت جایگاه آنها بر صفحه کلید رایانه ها” (ペルシア語). زبانشناسی و گویش های خراسان (انتشارات دانشگاه فردوسی مشهد) 7 (4): 109-129. ISSN 2008-7233. OCLC 1403136160.

[106] Khan, M. Aamir; A. Habib; M. N. Ali (2009). Corpus Based Mapping of Urdu Characters for Cell Phones (PDF). Proceedings of the Conference on Language & Technology (英語). Vol. CLT09. Society for Natural Language Processing, Pakistan. pp. 121–125. 2017年8月9日時点のオリジナル (PDF)よりアーカイブ. 2025年6月24日閲覧.

[107] Shahrul Kamaruddin; S.C. Beng; Zahid A. Khan (2010). “Ergonomic Design of a Computer Keyboard Layout for the Jawi Script” (英語). Pertanika Journal of Science and Technology (UPM Press) 18 (2): 271-292. CRID 1130282268502707968. ISSN 0128-7680. NCID AA12553738. OCLC 846918396. オリジナルの2025-06-24時点におけるアーカイブ。 2025年6月24日閲覧。.

[108] Wazir Ali; Jay Kumar; Junyu Lu; Zenglin Xu (2021). “Word Embedding based New Corpus for Low-resourced Language: Sindhi” (英語). arXiv:1911.12579 [cs.CL].

[Stefan_hindi-109] Stefan Trost. “Stefan Trost's website: Hindi”. Stefan Trost Media. 2025年1月21日時点のオリジナルよりアーカイブ。2025年3月22日閲覧。

[Riyal-2016-110] Manoj Kumar Riyal; Nikhil Kumar Rajput; Vinod Prasad Khanduri; Laxmi Rawat (2016). “Rank-Frequency Analysis of Characters in Garhwali Text: Emergence of Zipf's Law” (英語). Current Science (Bangalore Press) 110 (3): 429-443. CRID 1130000793569165568. doi:10.18520/cs/v110/i3/429-443. ISSN 0011-3891. NCID AA00622174. JSTOR 24906790. LCCN 44-42917. OCLC 01565678.

[111] Jaydeep Chipalkatti; Mihir Kulkarni (2017). “On the letter frequencies and entropy of written Marathi” (英語). arXiv:1707.08209 [cs.IT].

[112] Md. Abdus Sattar; Al-Mukaddim Khan Pathan; Mohammad Ameer Ali (2004). Development of an optimal bangla keyboard layout based on character and fingering frequency. National Conference on Computer Processing of Bangla (英語). Independent University, Bangladesh. pp. 38–46.

[113] Aunnoy K Mutasim; Ali Shihab Sabbir; M. Ashraful Amin (2016). Devising a Strategy for Playing Bangla Hangman (Jhulonto Manob) Based on Character Frequency Distribution. 5th International Conference on Informatics, Electronics & Vision (ICIEV) (英語). IEEE. doi:10.1109/ICIEV.2016.7759993. ISBN 978-1-5090-1269-5. OCLC 1010117749.

[Thai-2006-114] Aroonmanakun, Wirote (2006). List of Thai characters sorted by frequency (PDF). International Conference: Wisdom and Dynamism of Thai Language and Literature. 2025年2月19日時点のオリジナル (PDF)よりアーカイブ.

[Мьянмана-2005-115] Мьянмана Ба Нья Зо; Кубрин С.С. (2005). “Исследование информационности мьянманского алфавита” (ロシア語). Горный информационно-аналитический бюллетень (научно-технический журнал) (Горная книга) (10): 206-208. ISSN 0236-1493.

[116] Mello, Fernando (2007). Evolution of Tamil typedesign (PDF) (Thesis). University of Reading. 2012年3月11日時点のオリジナル (PDF)よりアーカイブ. 2025年7月8日閲覧.

[118] Gift Siromoney (1963). “Efficient methods of telegraphy, typewriting and teleprinting in Tamil” (英語). Tamil Culture (Academy of Tamil Culture): 116. CRID 1130000793628060800. ISSN 00399299. NCID AA00446876. LCCN 58-39040. OCLC 19767662. オリジナルの2016-07-22時点におけるアーカイブ。 2025年6月11日閲覧。.

[119] Shakrange Turrance Nandasara (2019). Development and Standardization of Sinhala Script Code for Digital Inclusion of Native Computer Users (博士（工学） thesis) (英語). Nagaoka University of Technology. p. 82.

[120] Melbin Kuruvila; Deepa P. Gopinath (2014). Entropy of Malayalam language and text compression using Huffman coding. 2014 First International Conference on Computational Systems and Communications (ICCSC) (英語). IEEE. pp. 150–155. doi:10.1109/COMPSC.2014.7032638. ISBN 978-1-4799-6013-2.

[121] Kavya Manohar (2019年7月18日). “Information, Entropy and Malayalam” (英語). 2025年3月8日時点のオリジナルよりアーカイブ。2025年7月1日閲覧。

[Sankaran-Kannada-122] Baskaran Sankaran (2025年5月30日). “Character Frequency Analysis for Kannada” (英語). Maadhyamik Technologies. 2025年7月8日時点のオリジナルよりアーカイブ。2025年7月8日閲覧。

[Sankaran-Telugu-123] Baskaran Sankaran (2025年5月30日). “Character Frequency Analysis for Telugu” (英語). Maadhyamik Technologies. 2025年7月9日時点のオリジナルよりアーカイブ。2025年7月10日閲覧。

[Stefan_greek-124] Stefan Trost. “Stefan Trost's website: greek”. Stefan Trost Media. 2024年10月8日時点のオリジナルよりアーカイブ。2025年3月22日閲覧。

[Stefan_hebrew-125] Stefan Trost. “Stefan Trost's website: Hebrew”. Stefan Trost Media. 2024年9月9日時点のオリジナルよりアーカイブ。2025年3月22日閲覧。

[FOOTNOTEChen2012235-126] Chen 2012, p. 235.

[FOOTNOTEChen2012234-127] Chen 2012, p. 234.

[128] 张冰冰; 吴媛梦; 王宇辰; 李洁; 杨澜 (2021). “键盘字母排序的频率理论” (中国語). 应用数学进展 (汉斯出版社) 10 (5): 1455-1464. doi:10.12677/AAM.2021.105155. ISSN 2324-7991. OCLC 811140029. オリジナルの2024-11-23時点におけるアーカイブ。.

[FOOTNOTE张冰冰20211461-129] 张冰冰 2021, p. 1461.

[FOOTNOTE金200511-130] 金 2005, p. 11.

[FOOTNOTE金200515–30-131] 金 2005, pp. 15–30.

[FOOTNOTE文教部1955108–116-132] 文教部 1955, pp. 108–116.

[FOOTNOTE文教部1955178-133] 文教部 1955, p. 178.

[134] 楊允言; 張學謙, eds. (2007). 台語文語料庫蒐集及語料庫為本台語書面語音節詞頻統計 (Report) (中国語（台湾）). 行政院國家科學委員會. 2019年12月22日時点のオリジナルよりアーカイブ. 2025年5月22日閲覧.

[135] “漢羅台語文音節頻率統計資料” (中国語). 行政院國家科學委員會. 2015年8月22日時点のオリジナルよりアーカイブ。2025年5月22日閲覧。

[136] 吉田真悟「現代台湾語書き言葉の多様性と規範形成―教科書・雑誌の分析から―」『日本台湾学会報』第21号、日本台湾学会、2019年、218-233頁、 CRID 1130282270201450880、 ISSN 1344-9834、 NCID BB00978269、 OCLC 838830824、オリジナルの2023年1月16日時点におけるアーカイブ、2025年5月22日閲覧。

[Aynekulu-2016-137] Gerawork Aynekulu (2016). Predlog poboljšanja korišćenja etiopskog pravopisa kreiranjem standardizovane virtualne tastature (PDF) (master matematika thesis) (英語). Beograd : Matematički fakultet. p. 27. MS_MT 597. 2023年4月11日時点のオリジナル (PDF)よりアーカイブ. 2025年6月11日閲覧.

[138] Magnús Snædal (2013). “Gothic letter (and phoneme) statistics” (英語). Studia Linguistica Universitatis Iagellonicae Cracoviensis (Wydawnictwo Uniwersytetu Jagiellońskiego) (130): 279-280. ISSN 1897-1059.

[139] 影浦峡『計量情報学 : 図書館/言語研究への応用』丸善出版、2000年、3-4頁。 CRID 1130282273081193344。 ISBN 978-4621047583。 NCID BA46412597。 OCLC 674466720。

[FOOTNOTEManning201720–21-140] Manning 2017, pp. 20–21.

[141] Vjaĉeslav Slavik Ivanov. “Frekvencvortaro” (エスペラント). 2024年2月24日時点のオリジナルよりアーカイブ。2025年3月22日閲覧。

[142] Yukio Tono; Makoto Yamazaki; kikuo Maekawa (2013) (英語). A frequency dictionary of Japanese : core vocabulary for learners. ラウトレッジ. pp. 10-242. CRID 1130000796915190400. ISBN 9780415610124. NCID BB11718339. LCCN 2012-21445. OCLC 731925237

[langfacts-143] “The OEC: Facts about the language” (英語). OxfordDictionaries.com. オックスフォード大学出版局. 2011年12月26日時点のオリジナルよりアーカイブ。2025年3月22日閲覧。

[144] 竹村和久. “「98円」や「2,980円」などの中途半端な価格設定が多いのはなぜでしょうか？”. 心理学ってなんだろう. 公益社団法人日本心理学会. 2024年12月9日時点のオリジナルよりアーカイブ。2025年3月22日閲覧。

[FOOTNOTESchindler200918-145] Schindler 2009, p. 18.

[FOOTNOTESchindler200917–18-146] Schindler 2009, pp. 17–18.

[147] J. Holdershaw; P. Gendall; R. Garland (1997). “The Widespread Use Of Odd Pricing In The Retail Sector” (英語). Marketing Bulletin 8: 53-58. ISSN 1176-645X. オリジナルの2025-03-16時点におけるアーカイブ。 2025年3月16日閲覧。.

[FOOTNOTE浜田201934–35-148] 浜田 2019, pp. 34–35.

[FOOTNOTEGolbeck20232-149] Golbeck 2023, p. 2.

[FOOTNOTE浜田201934-150] 浜田 2019, p. 34.

[FOOTNOTE浜田201933–35-151] 浜田 2019, pp. 33–35.

[152] Theodore P. Hill (1995). “The Significant-Digit Phenomenon” (英語). The American Mathematical Monthly (Taylor & Francis) 102 (4): 322-327. CRID 1130000793577184384. doi:10.2307/2974952. ISSN 0002-9890. NCID AA00048873. JSTOR 2974952. LCCN 39-16866. OCLC 1026998798. CODEN AMMYAE. オリジナルの2024-07-06時点におけるアーカイブ。 2025年6月11日閲覧。.

[153] Hrvoje Jošić; Berislav Žmuk (2018). “The application of Benford's law in psychological pricing detection” (英語). Journal of Economy and Business (University of Mostar, Faculty of Economics) (24): 40. doi:10.46458/27121097.2018.24.37. ISSN 1840-3255. オリジナルの2022-06-17時点におけるアーカイブ。 2025年6月11日閲覧。.

[FOOTNOTE石井1990193-154] 石井 1990, p. 193.

[FOOTNOTE石井1990193–194-155] 石井 1990, pp. 193–194.

[FOOTNOTE石井1990194-156] 石井 1990, p. 194.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[注釈 1]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

[57]

[58]

[59]

[60]

[61]

[62]

[63]

[64]

[65]

[66]

[67]

[68]

[69]

[70]

[71]

[72]

[73]

[74]

[75]

[76]

[77]

[78]

[79]

[80]

[81]

[82]

[注釈 2]

[84]

[85]

[86]

[87]

[88]

[89]

[90]

[91]

[92]

[93]

[94]

[95]

[96]

[97]

[98]

[99]

[100]

$d$	$P (d)$	$P (d)$ の度数
1	30.1%	30.1
2	17.6%	17.6
3	12.5%	12.5
4	9.7%	9.7
5	7.9%	7.9
6	6.7%	6.7
7	5.8%	5.8
8	5.1%	5.1
9	4.6%	4.6

文字の使用頻度とは？ わかりやすく解説

文字の出現頻度

背景