情報理論との関係とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > 情報理論との関係の意味・解説 

情報理論との関係

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/28 23:00 UTC 版)

tf-idf」の記事における「情報理論との関係」の解説

term frequency (tf) とinverse document frequency (idf) の両者情報理論観点から定式化されうる。この考えは、なぜそれらの積が文書結合情報量観点から意味があるのかを理解するのに役立つ。分布 p ( d , t ) {\displaystyle p(d,t)} に関する特徴的な仮定を以下の示す。 p ( d | t ) = 1 | { d ∈ D : t ∈ d } | {\displaystyle p(d|t)={\frac {1}{|\{d\in D:t\in d\}|}}} この仮定その意味は、Aizawaによれば、「ヒューリスティックtf-idf使われ方表している。」という。 特定の語 t {\displaystyle t} を含む事象条件として、コーパス D {\displaystyle D} の文書を「ランダム選択」する条件付きエントロピー英語版)は以下のように示される全文書は等し確率選択される仮定する)。 H ( D | T = t ) = − ∑ d p d | t logp d | t = − log ⁡ 1 | { d ∈ D : t ∈ d } | = log ⁡ | { d ∈ D : t ∈ d } | | D | + log ⁡ | D | = − i d f ( t ) + log ⁡ | D | {\displaystyle H({\cal {D}}|{\cal {T}}=t)=-\sum _{d}p_{d|t}\log p_{d|t}=-\log {\frac {1}{|\{d\in D:t\in d\}|}}=\log {\frac {|\{d\in D:t\in d\}|}{|D|}}+\log |D|=-\mathrm {idf} (t)+\log |D|} 表記に関して、 D {\displaystyle {\cal {D}}} と T {\displaystyle {\cal {T}}} は「ランダムな変数」であり、文書単語それぞれ選ばれることに相当する。ここで、相互情報量は以下のように表される。 M ( T ; D ) = H ( D ) − H ( D | T ) = ∑ t p t ⋅ ( H ( D ) − H ( D | W = t ) ) = ∑ t p ti d f ( t ) {\displaystyle M({\cal {T}};{\cal {D}})=H({\cal {D}})-H({\cal {D}}|{\cal {T}})=\sum _{t}p_{t}\cdot (H({\cal {D}})-H({\cal {D}}|W=t))=\sum _{t}p_{t}\cdot \mathrm {idf} (t)} 最後ステップp t {\displaystyle p_{t}} を展開することであり、文書の(ランダムな選択に関して条件無関係に単語選択する確率であるから、 M ( T ; D ) = ∑ t , d p t | d ⋅ p di d f ( t ) = ∑ t , d t f ( t , d ) ⋅ 1 | D | ⋅ i d f ( t ) = 1 | D | ∑ t , d t f ( t , d ) ⋅ i d f ( t ) . {\displaystyle M({\cal {T}};{\cal {D}})=\sum _{t,d}p_{t|d}\cdot p_{d}\cdot \mathrm {idf} (t)=\sum _{t,d}\mathrm {tf} (t,d)\cdot {\frac {1}{|D|}}\cdot \mathrm {idf} (t)={\frac {1}{|D|}}\sum _{t,d}\mathrm {tf} (t,d)\cdot \mathrm {idf} (t).} この式は、すべての有効な単語文書tf-idfの和は、文書単語同時確率分布特異性のすべてを考慮した文書単語の間の相互情報量立ち戻ることを表している。それゆえに、それぞれのtf-idfは、ある単語文書ペアに付け足された、「情報のかけら(bit of information)」を意味している。

※この「情報理論との関係」の解説は、「tf-idf」の解説の一部です。
「情報理論との関係」を含む「tf-idf」の記事については、「tf-idf」の概要を参照ください。

ウィキペディア小見出し辞書の「情報理論との関係」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「情報理論との関係」の関連用語

1
6% |||||

情報理論との関係のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



情報理論との関係のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaのtf-idf (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS