固有表現
【英】Named Entity
固有表現とは、人名や地名などといった固有名詞や、日付表現、時間表現などに関する総称である。自然言語処理において、文書の中から固有表現を抽出する研究課題は固有表現抽出と呼ばれる。
固有表現の種類については、アメリカ合衆国のDARPAが組織した評価型プロジェクトであるMUCでは、「組織名 (ORGANIZATION)、人名 (PERSON)、 地名 (LOCATION)、日付表現 (DATE)、時間表現 (TIME)、金額表現 (MONEY)、 割合表現 (PERCENT)」の7種類と規定されている。また、 情報抽出や情報検索に関する日本国内の評価型ワークショップであるIREXでは、MUCの分類に固有物名 (ARTIFACT)を加えた全8種類を固有表現と規定している。
- 固有表現のページへのリンク