Unicode照合アルゴリズムとは？わかりやすく解説

Unicode > Unicode照合アルゴリズム

Unicode照合アルゴリズム（ユニコードしょうごうアルゴリズム、英: Unicode collation algorithm、略称: UCA）とは、2つのUnicode 文字列を比較するアルゴリズムを定義したものである。これによって言語的に正しい大文字小文字変換、ソートが行える。

概要

Unicode照合アルゴリズムは、Unicodeテクニカル・レポート#10に規定されたアルゴリズムで、2つの文字列を比較する方式であり、カスタマイズ可能である。Unicodeで表現可能な文字および言語ならどんな種類のテキストでも、照合ないしソートの際にこのアルゴリズムが利用できる。

Unicodeテクニカルレポート#10は、デフォルトUnicode照合基本テーブル（Default Unicode Collation Element Table、略称DUCET）についても規定している。DUCETは言語ごとにカスタマイズ可能である。カスタマイズされたテーブルの一部は、共通ロケールデータリポジトリ（Common Locale Data Repository、CLDR）に収録されている。

オープンソースによる大規模なUnicode照合アルゴリズムの実装が、International Components for Unicode（ICU）計画によって行われている。ICUは地域化もサポートしており、CLDRをもとにしたUnicode照合の地域化がICUに含まれている。オンラインで参照できるICUロケールエクスプローラーを見れば、地域化の概要と相当数の各言語データがわかる。

外部リンク

“UTS #10: Unicode Collation Algorithm” (英語). Unicode Consortium (2012年2月1日). 2012年7月5日閲覧。

この項目は、文字や文字学に関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています（P:文字）。

この項目は、まだ閲覧者の調べものの参照としては役立たない、コンピュータに関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています（P:コンピュータ）。

Unicode照合アルゴリズムとは？わかりやすく解説