類似度
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/10/28 14:51 UTC 版)
ベクトルのなす角 θ の余弦である次の値をベクトルの類似度として、以下を定義する。 cos θ = ⟨ x , y ⟩ ‖ x ‖ ‖ y ‖ {\displaystyle \cos \theta ={\frac {\langle {\boldsymbol {x}},{\boldsymbol {y}}\rangle }{\lVert {\boldsymbol {x}}\rVert \lVert {\boldsymbol {y}}\rVert }}} この値は0から1の間の値を取るが、2つのベクトルx, yの向きが等しい(一次従属)ほど1に近づき、類似していることが分かる。 n個の要素をもつデータをn次のベクトル空間に落とし込み、それらがどれだけ類似しているかを比べるのにこの性質が利用されることがあり、特にコサイン類似度(英: Cosine similarity)と呼ばれる。この類似度を高速に算出するアルゴリズムにMinHash(英語版)などがあり、文章間の類似度判定などに用いられる。
※この「類似度」の解説は、「ベクトルのなす角」の解説の一部です。
「類似度」を含む「ベクトルのなす角」の記事については、「ベクトルのなす角」の概要を参照ください。
類似度
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2017/05/30 15:22 UTC 版)
分子類似度は、データを表示する記述子空間における計測距離の逆元としてよく記述される。距離の計量は、三角不等式を満たすユークリッド距離、または満たさない非ユークリッド距離に分類することができる。
※この「類似度」の解説は、「分子類似性」の解説の一部です。
「類似度」を含む「分子類似性」の記事については、「分子類似性」の概要を参照ください。
- 類似度のページへのリンク