tf-idfとは?

Weblio 辞書 > コンピュータ > IT用語辞典 > tf-idfの意味・解説 

tf-idf

フルスペル:term frequency–inverse document frequency
読み方てぃーえふあいでぃーえふ

tf-idfとは、情報探索テキストマイニングなどの分野利用される、文書中に出現した特定の単語どのくらい特徴的であるかを識別するための指標のことである。

tf-idfの内、「tf(term frequency)」は、その文書の中で特定の単語出現した回数を表し、「idf(inverse document frequency)」は、コーパス全体の中でその文書を含む文書数の自然対数を表し、「tf×idf」が、その文書中におけるその単語のtf-idf値となる。

tf-idfによる重み付け利用したアルゴリズム広くtf-idf法」と呼ばれ、キーワード抽出全文検索エンジン重み付けなどに応用される。また、ベクトル空間モデルにおいて、文書間の類似度を判定する場合などにも、コサイン類似度計算する際の、単語特徴ベクトルとしてtf-idfの値が利用される。

情報と社会のほかの用語一覧
情報工学:  人工生命  人工知能  Tay  tf-idf  適合率  tf-idf法  デコヒーレンス

tf-idf

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/12/10 19:02 UTC 版)

tf-idfは、文書中に含まれる単語の重要度を評価する手法の1つであり、主に情報検索やトピック分析などの分野で用いられている。




「tf-idf」の続きの解説一覧


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「tf-idf」の関連用語

tf-idfのお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



tf-idfのページの著作権
Weblio 辞書情報提供元は参加元一覧にて確認できます。

  
IT用語辞典バイナリIT用語辞典バイナリ
Copyright © 2005-2020 Weblio 辞書 IT用語辞典バイナリさくいん。 この記事は、IT用語辞典バイナリtf-idfの記事を利用しております。
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのtf-idf (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2020 Weblio RSS