偽陽性確率とは? わかりやすく解説

偽陽性確率

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/07/15 00:00 UTC 版)

ブルームフィルタ」の記事における「偽陽性確率」の解説

要素数 n {\displaystyle n} とフィルターサイズ m {\displaystyle m} から偽陽性確率 p {\displaystyle p} を求めたグラフ最適なハッシュ関数個数 k = ( m / n ) ln ⁡ 2 {\displaystyle k=(m/n)\ln 2} を前提としている。 ハッシュ関数配列上の各位置を同じ確率選択するものとする要素をひとつ追加する際、あるビット特定のハッシュ関数で 1 にセットされない確率次のうになる。 1 − 1 m {\displaystyle 1-{\frac {1}{m}}} . 従って k 個のハッシュ関数のいずれによっても、1つビットが 1 にセットされない確率次のうになる。 ( 1 − 1 m ) k {\displaystyle \left(1-{\frac {1}{m}}\right)^{k}} . n 個の要素追加した状態で、あるビットいまだに 0 である確率次のうになる。 ( 1 − 1 m ) k n {\displaystyle \left(1-{\frac {1}{m}}\right)^{kn}} ; したがって逆に 1 となっている確率次のとおり。 1 − ( 1 − 1 m ) k n {\displaystyle 1-\left(1-{\frac {1}{m}}\right)^{kn}} . ある要素ではないと分かっているデータに対してそれが集合要素であるかどうかテストしたとする。このときハッシュ関数得られる k 個のビットそれぞれが 1 となっている確率上記通りである。全てが 1 となっている確率、すなわちブルームフィルタがそのデータ集合要素であると誤って判定してしまう確率次のうになる。 ( 1 − ( 1 − 1 m ) k n ) k ≈ ( 1 − e − k n / m ) k {\displaystyle \left(1-\left(1-{\frac {1}{m}}\right)^{kn}\right)^{k}\approx \left(1-e^{-kn/m}\right)^{k}} . 明らかに、m(配列ビット数)が大きければ偽陽性発生率低くなり、n(追加する要素数)が多くなれば偽陽性発生率高くなる。いま m と n が決まっているとき、偽陽性発生率最小にする k(ハッシュ関数個数)は次のうになるk = m n ln ⁡ 2 ≈ 9 m 13 n ≈ 0.7 m n {\displaystyle k={\frac {m}{n}}\ln 2\approx {\frac {9m}{13n}}\approx 0.7{\frac {m}{n}}} , このときの偽陽性発生確率次の通り( 1 2 ) k ≈ 0.6185 m / n {\displaystyle \left({\frac {1}{2}}\right)^{k}\approx {0.6185}^{m/n}} .

※この「偽陽性確率」の解説は、「ブルームフィルタ」の解説の一部です。
「偽陽性確率」を含む「ブルームフィルタ」の記事については、「ブルームフィルタ」の概要を参照ください。

ウィキペディア小見出し辞書の「偽陽性確率」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「偽陽性確率」の関連用語

偽陽性確率のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



偽陽性確率のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaのブルームフィルタ (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2024 GRAS Group, Inc.RSS