tf-idfの派生
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/28 23:00 UTC 版)
多数の単語重み付け手法はtf-idfからの派生である。そのうちの一つはTF-PDF (term frequency * proportional document frequency) である。TF-PDFは2001年にメディアにおける新たなトピックを特定するという文脈で導入された。PDF成分は異なるドメインの中でどのくらいの頻度である単語が出現したかの差を測定する。他の派生にはTF-IDuFがある。TF-IDuFでは、idfは文書コーパスに基づき計算されず、検索または推薦される。例えば、idfはユーザの個人的な文書コレクションに基づいて計算される。その著者らはTF-IDuFはtf-idfと等しく効果的であるが、例えば、ユーザーモデリング(英語版)システムにおいて、外部の文書コーパスにアクセスできない時などに、応用可能であると報告している。
※この「tf-idfの派生」の解説は、「tf-idf」の解説の一部です。
「tf-idfの派生」を含む「tf-idf」の記事については、「tf-idf」の概要を参照ください。
- tf-idfの派生のページへのリンク