ベクトル空間モデル
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/09/12 03:13 UTC 版)
ベクトル空間モデルとは情報検索を行うためのアルゴリズムの一つ。ベクトル空間モデルによる検索は高次元のベクトル空間上に配置した検索対象のベクトル表現と検索語のベクトル表現の相関量をコサイン類似度、内積、距離等によって計算して関連度を求める。
メタデータ生成法
単語文書行列
単語文書行列とはメタデータの生成・表現法の一つであり、ベクトル空間モデルによる検索を行う際に非常に頻繁に用いられるメタデータの形式である。一般に単語文書行列は以下に示す構造を持つ。
単語文書行列:
文書diに単語tjがn回出現するとき、wijをnとし、行列を形成する。単純に出現回数を利用する以外にtf-idf等のアルゴリズムによって得た重みを用いる生成方法がしばしば行われる。
関連項目
ベクトル空間モデル
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/13 20:52 UTC 版)
キーワード等を各次元として設定した高次元ベクトル空間を想定し、検索の対象とするデータやユーザによる検索質問に何らかの加工を行いベクトル[要曖昧さ回避]を生成する。ベクトル空間上に検索対象となるベクトルを配置し、ベクトル化された検索質問とデータのベクトルの相関量(ベクトル間のコサイン、内積、ユークリッド距離などが用いられる。)によって検索の対象のデータと検索質問の関係の強さを計算するモデル。
※この「ベクトル空間モデル」の解説は、「情報検索」の解説の一部です。
「ベクトル空間モデル」を含む「情報検索」の記事については、「情報検索」の概要を参照ください。
- ベクトル空間モデルのページへのリンク