Okapi BM25
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/02/04 13:14 UTC 版)
Okapi BM25は、情報検索における順位付けの手法である。検索エンジンがクエリとの関連性に応じて、文書を順位付けするのに用いられる。1970年代から1980年代にかけて、スティーブン・ロバートソン (コンピュータ科学者)やカレン・スパーク・ジョーンズらが確率適合モデルに基づいて開発した。BM25の"BM"は、"Best Matching"の略である。
ロンドン大学シティ校が1980年代から1990年代にかけて開発したオカピ情報検索システム (Okapi information retrieval system) に最初に実装されたため、 "Okapi BM25" と呼ばれるが、単に、この手法自体の名称であるBM25とも呼ばれる。
順位付け手法
BM25は、bag-of-wordsを拡張した手法であり、文書内のクエリの単語同士の相互関係ではなく、文書におけるクエリの単語の出現頻度に基づいて、文書集合を順位付けする。
単語
- Okapi_BM25のページへのリンク