共起
別名:コロケーション
【英】collocation
共起とは、自然言語処理の分野において、任意の文書や文において、ある文字列とある文字列が同時に出現することである。
例えば、選挙に関する話題の中では、「選挙」という言葉と「出馬」という言葉などは、同時に出現する場合が比較的多い。このとき、コーパス(膨大な量の言語資料)からコロケーションを抽出することを「単語共起表現の抽出」などと呼ぶ。どのような基準に基づき、コロケーションと見なすか、ということに関しては「相互情報量」「z スコア」「対数尤度比」などの方法がある。
また、N-gramモデルなどの言語モデルの場合は、文字列の共起頻度を単語単位ではなく、任意のN-gram単位で集計するので、このようにして集計された共起関係は、必ずしも単語同士のものではない。
なお、あるキーワードと同時に出現するキーワード同士を突き詰めることによって、同じキーワードの「表記揺れ」を得ることを試みる研究などもある。
共起
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2023/05/30 06:42 UTC 版)
この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。(2010年1月) |
共起(きょうき,英:Co-occurrence,collocation)とは、自然言語処理の分野で、任意の文書や文において、ある文字列とある文字列が同時に出現することである[1]。関連して、共起語とは、ある言葉と一緒に文中でよく出てくる言葉のことである[2]。言語学者のゼリグ・ハリスが名付けた[3]。
例
「選挙」という言葉と「出馬」という言葉などは、同時に出現する場合が比較的多い[1]。
2016年に発生した、「大阪男児死体遺棄事件」の朝日新聞における記事データ13 件をKH coderによって解析した結果は
「被疑者B」は「内縁」「夫」と共起関係にあり、「逮捕」「遺体」は「死体」と共起関係にあった[4]。
脚注
- ^ a b “共起とは 「コロケーション」 (collocation) きょうき: - IT用語辞典バイナリ”. www.sophia-it.com. 2023年5月30日閲覧。
- ^ “3分でわかる共起語とは?オウンドメディア運営で知っておくべきこと”. blog.leapt.co.jp. 2023年5月30日閲覧。
- ^ “きょうき【共起】 - 広辞苑無料検索 ハイブリッド新辞林”. 広辞苑無料検索. 2023年5月30日閲覧。
- ^ 四方 由美・大谷 奈緒子・北出真紀恵・小川 祐喜子*・福田 朋実 (2018). “犯罪報道の共起ネットワーク分析(1)”. 宮崎公立大学人文学部紀要 25: 63 - 80.
関連項目
共起
「共起」の例文・使い方・用例・文例
共起と同じ種類の言葉
品詞の分類
- >> 「共起」を含む用語の索引
- 共起のページへのリンク