順位付け手法とは？わかりやすく解説

辞書 類語・対義語辞典 英和・和英辞典 日中中日辞典 日韓韓日辞典 古語辞典

その他の辞書▼
- フランス語辞典
- インドネシア語辞典
- タイ語辞典
- ベトナム語辞典

Weblio 辞書ヘルプ

556の専門辞書や国語辞典百科事典から一度に検索!

無料の翻訳ならWeblio翻訳！

初めての方へ参加元一覧

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > 順位付け手法の意味・解説

ウィキペディア小見出し辞書

索引トップ用語の索引ランキング

順位付け手法

出典: フリー百科事典『ウィキペディア（Wikipedia）』 (2021/09/13 15:08 UTC 版)

「Okapi BM25」の記事における「順位付け手法」の解説

BM25は、bag-of-wordsを拡張した手法であり、文書内のクエリの単語同士の相互関係ではなく、文書におけるクエリの単語の出現頻度に基づいて、文書集合を順位付けする。単語 q 1 , . . . , q n {\displaystyle q_{1},...,q_{n}} を含むクエリQが与えられたとき、文書DのBM25 スコアは、 score ( D , Q ) = ∑ i = 1 n IDF ( q i ) ⋅ f ( q i , D ) ⋅ ( k 1 + 1 ) f ( q i , D ) + k 1 ⋅ ( 1 − b + b ⋅ | D | avgdl ) , {\displaystyle {\text{score}}(D,Q)=\sum _{i=1}^{n}{\text{IDF}}(q_{i})\cdot {\frac {f(q_{i},D)\cdot (k_{1}+1)}{f(q_{i},D)+k_{1}\cdot \left(1-b +b\cdot {\frac {|D|}{\text{avgdl}}}\right)}},} と定義される。このとき、 f ( q i , D ) {\displaystyle f(q_{i},D)} を文書Dにおける単語の出現頻度、 | D | {\displaystyle |D|} を文書Dの単語数、avgdlを文書集合の平均単語数とする。 k 1 {\displaystyle k_{1}} およびbは任意のパラメータであり、 k 1 ∈ [ 1.2 , 2.0 ] {\displaystyle k_{1}\in [1.2,2.0]} 、 b = 0.75 {\displaystyle b=0.75} とされることが多い。また、単語 q i {\displaystyle q_{i}} のidf値は、 IDF ( q i ) = log ⁡ N − n ( q i ) + 0.5 n ( q i ) + 0.5 , {\displaystyle {\text{IDF}}(q_{i})=\log {\frac {N-n(q_{i})+0.5}{n(q_{i})+0.5}},} と定義される。このとき、Nを全文書数、 n ( q i ) {\displaystyle n(q_{i})} を q i {\displaystyle q_{i}} を含む文書数とする。また、 IDF ( q i ) {\displaystyle {\text{IDF}}(q_{i})} には複数の定義があり、上記の定義式はその1つである。BM25では、二項独立モデル（Binary Independence Model（英語版））に基づいて導出された。ただし、上記の定義式では、半分以上の文書集合に出現する単語のidf値が負になるため、ほぼ同一の2つの文書について、半分以上の文書集合に出現する単語を含む文書と含まない文書とでは、後者のBM25 スコアが大きくなってしまうことがある。そのため、実用上は、 idf値の最小値を0とし、一般的な用語を完全に無視する idf値の最小値を定数 ϵ {\displaystyle \epsilon } とし、一般的な用語を完全に無視することを避けつつ、影響を減らす idfが必ず正となる定義式に変えるといった処理がなされる。

※この「順位付け手法」の解説は、「Okapi BM25」の解説の一部です。
「順位付け手法」を含む「Okapi BM25」の記事については、「Okapi BM25」の概要を参照ください。

ウィキペディア小見出し辞書の「順位付け手法」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。お問い合わせ。

《東風》の正しい読み方

オールスター感謝祭

>> 「順位付け手法」を含む用語の索引
順位付け手法のページへのリンク

辞書ショートカット

1 ウィキペディア小見出し辞書

カテゴリ一覧

＋ビジネス

＋業界用語

＋コンピュータ

＋自動車・バイク

＋船

＋建築・不動産

＋ヘルスケア

＋スポーツ

＋辞書・百科事典

すべての辞書の索引

Weblioのサービス

「順位付け手法」の関連用語

1

テストケースの優先順位付け

ウィキペディア小見出し辞書

54% |||||

2

百科事典

8% |||||

順位付け手法のお隣キーワード

順位の譲渡・放棄

順位を破壊！再生ランキング

順位ポイントに基づく順位

順位ポイントの付け方

順位予想クイズこむちぇっく6

順位付け手法

順位別成績

順位制の利点

順位及び得点

順位変動の推移

検索ランキング

順位付け手法のページの著作権
Weblio 辞書情報提供元は参加元一覧にて確認できます。


	Text is available under GNU Free Documentation License (GFDL). Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、WikipediaのOkapi BM25 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

ビジネス｜業界用語｜コンピュータ｜電車｜自動車・バイク｜船｜工学｜建築・不動産｜学問
 文化｜生活｜ヘルスケア｜趣味｜スポーツ｜生物｜食品｜人名｜方言｜辞書・百科事典

ご利用にあたって

・Weblio辞書とは

・検索の仕方

・利用規約

・プライバシーポリシー

・サイトマップ

便利な機能

・ウェブリオのアプリ

・画像から探す

お問合せ・ご要望

・お問い合わせ

会社概要

・公式企業ページ

・会社情報

・採用情報

ウェブリオのサービス

・Weblio 辞書

・類語・対義語辞典

・英和辞典・和英辞典

・Weblio翻訳

・日中中日辞典

・日韓韓日辞典

・フランス語辞典

・インドネシア語辞典

・タイ語辞典

・ベトナム語辞典

・古語辞典

©2025 GRAS Group, Inc.RSS