JIS_X_4061とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > 百科事典 > JIS_X_4061の意味・解説 

日本語文字列照合順番

(JIS_X_4061 から転送)

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/05/21 13:20 UTC 版)

日本語文字列照合順番(にほんごもじれつしょうごうじゅんばん)は、日本語文字列ソート順を示し、日本JIS規格JIS X 4061で定められている。一般には辞書順(じしょじゅん)、五十音順(ごじゅうおんじゅん)やあいうえお順と呼ばれることが多い。

概要

日本語の国語辞典などの多くの辞書類や各種書物の索引において、この規格で決められた順序で並べ替えが行われる。一般には日本語での読みについて濁点半濁点を無視し、小書き仮名清音文字(濁点などが付かない文字)に変更し長音符は前の文字の母音にして並べた後、同一の並び順になる場合は小書き文字→清音文字→濁点のある文字→半濁点のある文字の順に並べる。

仮名での並べ替え

通常辞書で扱われるよみがなに変更してから並べ替える場合について記載する。

  1. 一般に辞書などで並べ替える時は、漢字などがある場合は該当の文字の読み仮名に変更し、その後で並べ替えを行う。辞書ではアルファベットで表記される文字列も全て読み仮名に変更する。
  2. 仮名に対し、次のように置き換える
    • 「ぁ」「ゃ」「っ」などの小書き文字はその基底文字である「あ」「や」「つ」などに置き換える。
    • 「が」「ば」などの濁点付き文字はその基底文字である「か」「は」などに置き換える。
    • 「ぱ」「ぴ」などの半濁点付き文字はその基底文字である「は」「ひ」などに置き換える。
    • 片仮名で表される文字は平仮名に変更する。
    • 「ゝ」「ゞ」「ヽ」「ヾ」は「ゝ」に置き換える。
  3. 長音符「ー」を次のルールで置き換える。
    • 前の文字が「あ」「か」「さ」「た」「な」「は」「ま」「や」「ら」「わ」→「あ」
    • 前の文字が「い」「き」「し」「ち」「に」「ひ」「み」「り」「ゐ」→「い」
    • 前の文字が「う」「く」「す」「つ」「ぬ」「ふ」「む」「ゆ」「る」→「う」
    • 前の文字が「え」「け」「せ」「て」「ね」「へ」「め」「れ」「ゑ」→「え」
    • 前の文字が「お」「こ」「そ」「と」「の」「ほ」「も」「よ」「ろ」「を」→「お」
    • 前の文字が「ん」→「ん」[1]
    • 前の文字が上記以外→置き換えない
  4. 繰り返し記号の「ゝ」を次のルールで置き換える。
    • 直前の文字があり、上記変換後も繰り返し記号あるいは長音符以外の場合は直前の文字に置き換える。
    • 直前の文字がない場合は置き換えない。
  5. 上記置き換えて出来た文字列に付いて、文字列の先頭より次の順序で比較して先にあるものが先になるように並べ替える。
    • 「あ」「い」「う」「え」「お」「か」「き」「く」「け」「こ」「さ」「し」「す」「せ」「そ」「た」「ち」「つ」「て」「と」「な」「に」「ぬ」「ね」「の」「は」「ひ」「ふ」「へ」「ほ」「ま」「み」「む」「め」「も」「や」「ゆ」「よ」「ら」「り」「る」「れ」「ろ」「わ」「ゐ」「ゑ」「を」「ん」「ゝ」「ー」
  6. 上記で文字列の並べ替えを行った後、一致する順位となる文字列は、次のルールで並べる。
    1. 清音文字→濁点付き文字→半濁点付き文字
    2. 長音符→小書き文字→繰り返し記号→通常文字[2]
    3. 平仮名→片仮名

読み仮名は一般に決まるものであるが、読みが別に示されていない場合は機械的に正しい読みを判断することは困難であることが多い。その場合は1つの漢字に対し1つの読みを定義しその読みの順序で並べる代表読み照合を用いるか、その漢字の代表読みの先頭文字だけで判断する簡易代表読み照合を用いる。

汎用的に扱う場合

仮名に変換せずに並べ替える場合について記載する。

  1. 文字クラスで下記順序に並べ替える。
    1. スペース(スペース和字間隔
    2. 記述記号(句点疑問符ダッシュ (記号)など)
    3. 括弧記号(括弧引用符
    4. 学術記号(演算記号などの数学記号雄記号雌記号
    5. 一般記号(丸印矢印アンパサンドなど)
    6. 単位記号(円記号パーセント記号など)
    7. アラビア数字(09
    8. 欧字記号(ギリシャ文字キリル文字
    9. ラテンアルファベット(アルファベット及びマクロンサーカムフレックス付きアルファベット)
    10. 仮名(#仮名での並べ替え参照)
    11. 漢字(「」「」「」「」「」及び漢字)
    12. 下駄記号(下駄記号
  2. 同一クラスも文字は各クラスごとの規定に従い並べ替え順を決める。

規定以外の文字を使用する場合は上記クラスのいずれかに含めるか、新たなクラスを作成して並べ替え順を決める。ただし、下駄記号より後ろのクラスを作成しては行けないなどの規定が存在する。

ウィキペディアにおける実装

  • ウィキペディアでは上記実装が出来ないため、仮想的に項目名の基底文字のみの文字列を個々の記事に定義して並べ替えを行っている。

関連項目

脚注

  1. ^ 「んー」の文字は一般の発音通り「んん」になる
  2. ^ 上記で先に並べその後で行うため、仮にJIS X 0213にある小書き片仮名「プ」 にあてはめた場合は「ブ」の後で、「プ」の前に並ぶ。

「JIS X 4061」の例文・使い方・用例・文例

Weblio日本語例文用例辞書はプログラムで機械的に例文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「JIS_X_4061」の関連用語

JIS_X_4061のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



JIS_X_4061のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの日本語文字列照合順番 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
Tanaka Corpusのコンテンツは、特に明示されている場合を除いて、次のライセンスに従います:
 Creative Commons Attribution (CC-BY) 2.0 France.
この対訳データはCreative Commons Attribution 3.0 Unportedでライセンスされています。
浜島書店 Catch a Wave
Copyright © 1995-2025 Hamajima Shoten, Publishers. All rights reserved.
株式会社ベネッセコーポレーション株式会社ベネッセコーポレーション
Copyright © Benesse Holdings, Inc. All rights reserved.
研究社研究社
Copyright (c) 1995-2025 Kenkyusha Co., Ltd. All rights reserved.
日本語WordNet日本語WordNet
日本語ワードネット1.1版 (C) 情報通信研究機構, 2009-2010 License All rights reserved.
WordNet 3.0 Copyright 2006 by Princeton University. All rights reserved. License
日外アソシエーツ株式会社日外アソシエーツ株式会社
Copyright (C) 1994- Nichigai Associates, Inc., All rights reserved.
「斎藤和英大辞典」斎藤秀三郎著、日外アソシエーツ辞書編集部編
EDRDGEDRDG
This page uses the JMdict dictionary files. These files are the property of the Electronic Dictionary Research and Development Group, and are used in conformance with the Group's licence.

©2025 GRAS Group, Inc.RSS