仮名での並べ替え
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/02/03 09:39 UTC 版)
「日本語文字列照合順番」の記事における「仮名での並べ替え」の解説
通常辞書で扱われるよみがなに変更してから並べ替える場合について記載する。 一般に辞書などで並べ替える時は、漢字などがある場合は該当の文字の読み仮名に変更し、その後で並べ替えを行う。辞書ではアルファベットで表記される文字列も全て読み仮名に変更する。 仮名に対し、次のように置き換える「ぁ」「ゃ」「っ」などの小書き文字はその基底文字である「あ」「や」「つ」などに置き換える。 「が」「ば」などの濁点付き文字はその基底文字である「か」「は」などに置き換える。 「ぱ」「ぴ」などの半濁点付き文字はその基底文字である「は」「ひ」などに置き換える。 片仮名で表される文字は平仮名に変更する。 「ゝ」「ゞ」「ヽ」「ヾ」は「ゝ」に置き換える。 長音符「ー」を次のルールで置き換える。前の文字が「あ」「か」「さ」「た」「な」「は」「ま」「や」「ら」「わ」→「あ」 前の文字が「い」「き」「し」「ち」「に」「ひ」「み」「り」「ゐ」→「い」 前の文字が「う」「く」「す」「つ」「ぬ」「ふ」「む」「ゆ」「る」→「う」 前の文字が「え」「け」「せ」「て」「ね」「へ」「め」「れ」「ゑ」→「え」 前の文字が「お」「こ」「そ」「と」「の」「ほ」「も」「よ」「ろ」「を」→「お」 前の文字が「ん」→「ん」 前の文字が上記以外→置き換えない 繰り返し記号の「ゝ」を次のルールで置き換える。直前の文字があり、上記変換後も繰り返し記号あるいは長音符以外の場合は直前の文字に置き換える。 直前の文字がない場合は置き換えない。 上記置き換えて出来た文字列に付いて、文字列の先頭より次の順序で比較して先にあるものが先になるように並べ替える。「あ」「い」「う」「え」「お」「か」「き」「く」「け」「こ」「さ」「し」「す」「せ」「そ」「た」「ち」「つ」「て」「と」「な」「に」「ぬ」「ね」「の」「は」「ひ」「ふ」「へ」「ほ」「ま」「み」「む」「め」「も」「や」「ゆ」「よ」「ら」「り」「る」「れ」「ろ」「わ」「ゐ」「ゑ」「を」「ん」「ゝ」「ー」 上記で文字列の並べ替えを行った後、一致する順位となる文字列は、次のルールで並べる。清音文字→濁点付き文字→半濁点付き文字 長音符→小書き文字→繰り返し記号→通常文字 平仮名→片仮名 読み仮名は一般に決まるものであるが、読みが別に示されていない場合は機械的に正しい読みを判断することは困難であることが多い。その場合は1つの漢字に対し1つの読みを定義しその読みの順序で並べる代表読み照合を用いるか、その漢字の代表読みの先頭文字だけで判断する簡易代表読み照合を用いる。
※この「仮名での並べ替え」の解説は、「日本語文字列照合順番」の解説の一部です。
「仮名での並べ替え」を含む「日本語文字列照合順番」の記事については、「日本語文字列照合順番」の概要を参照ください。
- 仮名での並べ替えのページへのリンク