BM25の改変版
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/09/13 15:08 UTC 版)
「Okapi BM25」の記事における「BM25の改変版」の解説
BM25の係数bを極値に変えたものは、BM11( b = 1 {\displaystyle b=1} のとき)やBM15( b = 0 {\displaystyle b=0} のとき)という。 BM25F:重要度や長さが異なるフィールド(見出しや本文、アンカーテキストなど)で構成される文書を考慮した、BM25の改変版である。 BM25+:BM25では、単語出現頻度が文書長で適切に正規化されていないため、クエリを含む長い文書よりクエリを含まない短い文書の方がBM25スコアが高くなることがある。BM25+は、BM25の上記について改良するために開発された。BM25+の定義式では任意のパラメータ δ {\displaystyle \delta } が追加されている(訓練データがないときの初期値は1.0)。BM25+の定義式は、下式である。 score ( D , Q ) = ∑ i = 1 n IDF ( q i ) ⋅ [ f ( q i , D ) ⋅ ( k 1 + 1 ) f ( q i , D ) + k 1 ⋅ ( 1 − b + b ⋅ | D | avgdl ) + δ ] {\displaystyle {\text{score}}(D,Q)=\sum _{i=1}^{n}{\text{IDF}}(q_{i})\cdot \left[{\frac {f(q_{i},D)\cdot (k_{1}+1)}{f(q_{i},D)+k_{1}\cdot \left(1-b+b\cdot {\frac {|D|}{\text{avgdl}}}\right)}}+\delta \right]}
※この「BM25の改変版」の解説は、「Okapi BM25」の解説の一部です。
「BM25の改変版」を含む「Okapi BM25」の記事については、「Okapi BM25」の概要を参照ください。
- BM25の改変版のページへのリンク