調整ランド指数
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/10/05 08:23 UTC 版)
調整ランド指数は、ランド指数を偶然性に基づいて補正したものである。このような偶然性の補正は、ランダムに指定されたクラスタリング間のすべてのペアワイズ比較の類似度の期待値を使用して、ベースラインを確立します。従来、ランド指数は、クラスタリングのための順列モデル(クラスタリング内のクラスターの数とサイズは固定されており、すべてのランダムクラスタリングは、固定されたクラスター間で要素をシャッフルすることによって生成される)を用いて補正されていた。 しかし、順列モデルの前提は頻繁に破られる。多くのクラスタリングのシナリオでは、クラスターの数またはクラスターのサイズ分布が大幅に異なる。例えば、K平均法では、クラスターの数は実務者によって固定されているが、それらのクラスターのサイズはデータから推測されるものとする。調整ランド指数のバリエーションは、ランダムなクラスタリングのさまざまなモデルを説明する。 ランド指数は0から1の間の値しか得られないが、調整ランド指数は、当てはまりが期待値よりも悪い場合、負の値を取り得る。
※この「調整ランド指数」の解説は、「ランド指数」の解説の一部です。
「調整ランド指数」を含む「ランド指数」の記事については、「ランド指数」の概要を参照ください。
- 調整ランド指数のページへのリンク