単純ベイズ確率モデルとは何？わかりやすく解説 Weblio辞書

索引トップ用語の索引ランキング

単純ベイズ確率モデル

出典: フリー百科事典『ウィキペディア（Wikipedia）』 (2021/03/05 20:26 UTC 版)

「単純ベイズ分類器」の記事における「単純ベイズ確率モデル」の解説

抽象的には、分類器の確率モデルは次のような依存クラス変数 C {\displaystyle C} についての条件付きモデルである。クラスは、いくつかの特徴変数 F 1 {\displaystyle F_{1}} から F n {\displaystyle F_{n}} までに依存している。 p ( C | F 1 , … , F n ) {\displaystyle p(C\vert F_{1},\dots ,F_{n})\,} 問題は、特徴数 n {\displaystyle n} が大きいとき、あるいは特徴がとりうる値の範囲が大きいとき、確率表に基づいたようなモデルは現実的でなくなることである。そこで、モデルをより扱いやすく変形する。ベイズの定理を使えば、次のようになる。 p ( C | F 1 , … , F n ) = p ( C ) p ( F 1 , … , F n | C ) p ( F 1 , … , F n ) {\displaystyle p(C\vert F_{1},\dots ,F_{n})={\frac {p(C)\ p(F_{1},\dots ,F_{n}\vert C)}{p(F_{1},\dots ,F_{n})}}\,} この式を英語で表すと次のようになる（Posterior = 事後、Prior = 事前、Likelihood = 尤度、Evidence = 証拠）。 P o s t e r i o r = P r i o r × L i k e l i h o o d E v i d e n c e {\displaystyle Posterior={\frac {Prior\times Likelihood}{Evidence}}\,} 実際には、分母は C {\displaystyle C} に依存しておらず、分母が実質的に一定であるように F i {\displaystyle F_{i}} が与えられるため、分子だけを考慮すればよい。分子は、次のように表される同時確率モデルと等価である。 p ( C , F 1 , … , F n ) {\displaystyle p(C,F_{1},\dots ,F_{n})\,} これに条件付き確率の定義を繰り返し適用すると、次のように書き換えられる。 p ( C , F 1 , … , F n ) {\displaystyle p(C,F_{1},\dots ,F_{n})\,} = p ( C ) p ( F 1 , … , F n | C ) {\displaystyle =p(C)\ p(F_{1},\dots ,F_{n}\vert C)} = p ( C ) p ( F 1 | C ) p ( F 2 , … , F n | C , F 1 ) {\displaystyle =p(C)\ p(F_{1}\vert C)\ p(F_{2},\dots ,F_{n}\vert C,F_{1})} = p ( C ) p ( F 1 | C ) p ( F 2 | C , F 1 ) p ( F 3 , … , F n | C , F 1 , F 2 ) {\displaystyle =p(C)\ p(F_{1}\vert C)\ p(F_{2}\vert C,F_{1})\ p(F_{3},\dots ,F_{n}\vert C,F_{1},F_{2})} = p ( C ) p ( F 1 | C ) p ( F 2 | C , F 1 ) p ( F 3 | C , F 1 , F 2 ) p ( F 4 , … , F n | C , F 1 , F 2 , F 3 ) {\displaystyle =p(C)\ p(F_{1}\vert C)\ p(F_{2}\vert C,F_{1})\ p(F_{3}\vert C,F_{1},F_{2})\ p(F_{4},\dots ,F_{n}\vert C,F_{1},F_{2},F_{3})} ここで、「単純」な条件付き独立性（英語版）を仮定する。すなわち、各特徴変数 F 1 , … , F n {\displaystyle F_{1},\dots ,F_{n}} が条件付きで独立であるとする。独立性より、次の式が成り立つ。 p ( F i ∣ C , F 1 , … , F i − 1 ) = p ( F i ∣ C ) {\displaystyle p(F_{i}\mid C,F_{1},\ldots ,F_{i-1})=p(F_{i}\mid C)\,} すると、同時モデルは次のように表される。 p ( C , F 1 , … , F n ) = p ( C ) p ( F 1 | C ) p ( F 2 | C ) p ( F 3 | C ) ⋯ {\displaystyle p(C,F_{1},\dots ,F_{n})=p(C)\ p(F_{1}\vert C)\ p(F_{2}\vert C)\ p(F_{3}\vert C)\ \cdots \,} = p ( C ) ∏ i = 1 n p ( F i | C ) {\displaystyle =p(C)\prod _{i=1}^{n}p(F_{i}\vert C)\,} つまり、上述のような独立性の仮定のもとで、クラス変数 C {\displaystyle C} の条件付き分布は次のように表される。 p ( C | F 1 , … , F n ) = 1 Z p ( C ) ∏ i = 1 n p ( F i | C ) {\displaystyle p(C\vert F_{1},\dots ,F_{n})={\frac {1}{Z}}p(C)\prod _{i=1}^{n}p(F_{i}\vert C)} ここで、 Z {\displaystyle Z} は F 1 , … , F n {\displaystyle F_{1},\dots ,F_{n}} にのみ依存する係数であり、特徴変数群の値が既知であれば定数となる。このようなモデルの方が扱いやすい。いわゆる「クラス事前確率」 p ( C ) {\displaystyle p(C)} と独立確率分布 p ( F i | C ) {\displaystyle p(F_{i}\vert C)} に分かれているからである。 k {\displaystyle k} 個のクラスがあり、 p ( F i ) {\displaystyle p(F_{i})} のモデルを r {\displaystyle r} 個のパラメータで表現できるとき、対応する単純ベイズモデルは (k − 1) + n r k 個のパラメータを持つ。二項分類では k = 2 {\displaystyle k=2} であり、 n {\displaystyle n} は予測に使われる2値の特徴の個数である。

※この「単純ベイズ確率モデル」の解説は、「単純ベイズ分類器」の解説の一部です。
「単純ベイズ確率モデル」を含む「単純ベイズ分類器」の記事については、「単純ベイズ分類器」の概要を参照ください。

ウィキペディア小見出し辞書の「単純ベイズ確率モデル」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。お問い合わせ。

>> 「単純ベイズ確率モデル」を含む用語の索引
単純ベイズ確率モデルのページへのリンク

単純ベイズ確率モデルとは？わかりやすく解説

単純ベイズ確率モデル

「単純ベイズ確率モデル」の関連用語


	Text is available under GNU Free Documentation License (GFDL). Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの単純ベイズ分類器 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

単純ベイズ確率モデルとは？ わかりやすく解説

単純ベイズ確率モデル

急上昇のことば

「単純ベイズ確率モデル」の関連用語

単純ベイズ確率モデルとは？わかりやすく解説