文書の概念
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2018/01/10 13:43 UTC 版)
文書を表現するのによく用いられる方法としてベクトル空間モデルなどがあり、これは、文書をひとつのアイテムと考えた場合、アイテムのメタデータ表現の一つである。 文書は単語の連なりから構成されており、文書中に現れる単語とその相対的な重みづけ(tf-idf)で表現することで、文書をベクトル空間の中で特定することが可能となる。つまり、文書を多次元のベクトル空間でひとつの矢印で表現でき、これは文書の特徴、つまり概念を意味するものと考えられる。 概念の解析については潜在意味解析も参照のこと。応用例が紹介されている。
※この「文書の概念」の解説は、「概念検索」の解説の一部です。
「文書の概念」を含む「概念検索」の記事については、「概念検索」の概要を参照ください。
- 文書の概念のページへのリンク