固有表現抽出
【英】named entity extraction, named entity recognition
固有表現抽出とは、人名や地名などといった固有名詞や、日付、時間などに関する表現を、テキストから抜き出すこと、またはそのような手法を研究する自然言語処理における情報抽出の一分野のことである。
「固有表現」という概念や「固有表現抽出」という研究課題は、1990年頃アメリカ合衆国のDARPAが組織した評価型プロジェクト MUC (Message Understanding Conference)で初めて提唱されたと言われている。
具体的な手法としては、予め固有表現のタグが付与されたタグ付きコーパスをテストコレクションとして機械学習による統計的な手法で抽出を行う試みのや、人名や時間表現などそれぞれの固有表現に対して、それらの語の文字列のパターンを多数の正規表現などを使って抽出するヒューリスティックな手法などがある。また、固有表現をカテゴリごとなどに細かく体系的に整理したものは、「固有表現オントロジー」などと呼ばれる。
固有表現抽出と同じ種類の言葉
Weblioに収録されているすべての辞書から固有表現抽出を検索する場合は、下記のリンクをクリックしてください。

- 固有表現抽出のページへのリンク