固有表現分類
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/07/29 05:00 UTC 版)
具体例に示したように、固有表現には人名や日付表現など幾つかの分類があり、この分類を定義する必要がある。 MUCでは、組織名 (ORGANIZATION)、人名 (PERSON)、地名 (LOCATION)、日付表現 (DATE)、時間表現 (TIME)、金額表現 (MONEY)、割合表現 (PERCENT) の7種類を定義した。 IREX では MUC の分類に固有物名 (ARTIFACT) を加えた全8種類の分類を採用した。 これらの分類にはそれらの範囲について曖昧性などの問題がある。ニューヨーク大学の関根聡らは MUC・IREX の固有表現分類を元に拡張固有表現階層 (Extended Named Entity Hierarchy) を提唱している。これは他の分類と異なり階層構造を持ち、様々な粒度での分類を可能にしている。
※この「固有表現分類」の解説は、「固有表現抽出」の解説の一部です。
「固有表現分類」を含む「固有表現抽出」の記事については、「固有表現抽出」の概要を参照ください。
- 固有表現分類のページへのリンク