共起
別名:コロケーション
【英】collocation
共起とは、自然言語処理の分野において、任意の文書や文において、ある文字列とある文字列が同時に出現することである。
例えば、選挙に関する話題の中では、「選挙」という言葉と「出馬」という言葉などは、同時に出現する場合が比較的多い。このとき、コーパス(膨大な量の言語資料)からコロケーションを抽出することを「単語共起表現の抽出」などと呼ぶ。どのような基準に基づき、コロケーションと見なすか、ということに関しては「相互情報量」「z スコア」「対数尤度比」などの方法がある。
また、N-gramモデルなどの言語モデルの場合は、文字列の共起頻度を単語単位ではなく、任意のN-gram単位で集計するので、このようにして集計された共起関係は、必ずしも単語同士のものではない。
なお、あるキーワードと同時に出現するキーワード同士を突き詰めることによって、同じキーワードの「表記揺れ」を得ることを試みる研究などもある。
共起と同じ種類の言葉
品詞の分類
Weblioに収録されているすべての辞書から共起を検索する場合は、下記のリンクをクリックしてください。
全ての辞書から共起を検索
- >> 「共起」を含む用語の索引
- 共起のページへのリンク