テキストマイニング
(テキスト解析 から転送)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/08/03 03:33 UTC 版)
テキストマイニング(英: text mining)は、文字列を対象としたデータマイニングのことである。通常の文章からなるデータを単語や文節などの単位で区切り、それらの出現の頻度や共出現の相関、共起関係、出現傾向、時系列などを解析することで有用な情報を取り出す、テキストデータの分析方法である[1]。計算的テキスト分析(computational text analysis)、テキストアナリシス(text analysis)と呼ぶこともあるが、情報処理の分野ではテキストマイニングと呼ばれている。
- 1 テキストマイニングとは
- 2 テキストマイニングの概要
テキスト解析
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/06/03 05:29 UTC 版)
「バイオインフォマティクス」の記事における「テキスト解析」の解説
今日までに、膨大な数の学術論文が発表されてきており、その数はますます増加している。そのため、すべての論文を読むことは事実上不可能であり、研究の領域は細分化されていく傾向がある。計算言語学による文献分析では、計算と統計に基づく言語学的解析を通じて、増大するテキストリソースからマイニングすることを目的としている。例えば、略語認識(生物学用語の正式名称とその略語を特定する)、名前付きエンティティの認識(遺伝子名などの生物学的用語を認識して特定する)、タンパク質間相互作用(どのタンパク質がどのタンパク質と相互作用するかをテキストから特定する)、などに関して研究が進められている[要出典]。
※この「テキスト解析」の解説は、「バイオインフォマティクス」の解説の一部です。
「テキスト解析」を含む「バイオインフォマティクス」の記事については、「バイオインフォマティクス」の概要を参照ください。
- テキスト解析のページへのリンク