カーネル密度推定とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > 百科事典 > カーネル密度推定の意味・解説 

カーネル密度推定

(Kernel density estimation から転送)

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/12/01 22:33 UTC 版)

ナビゲーションに移動 検索に移動
正規分布の100個の乱数と異なる平滑化帯域幅によるカーネル密度推定。

カーネル密度推定(カーネルみつどすいてい、: kernel density estimation)は、統計学において、確率変数確率密度関数を推定するノンパラメトリック手法のひとつ。エマニュエル・パルツェンの名をとってパルツェン窓: Parzen window)とも。大まかに言えば、ある母集団標本のデータが与えられたとき、カーネル密度推定を使えばその母集団のデータを外挿できる。

ヒストグラムは、一様なカーネル関数によるカーネル密度推定量と見ることもできる。

定義

x1, x2, ..., xn を(未知の)確率密度関数 ƒ を持つ独立同分布からの標本とする。カーネル関数 K、バンド幅(平滑化パラメータ)hカーネル密度推定量: kernel density estimator)とは

6つのガウス曲線(赤)とそれらの総和(青)。パルツェン窓密度推定 f(x) は、この総和を6(元のガウス曲線の数)で割ることで得られる。ガウス関数の分散は 0.5 に設定されている。見ての通り、標本点が稠密にあるほど、密度推定値は大きくなる。

特性

確率密度関数 ƒ の L2 リスク関数 とする。確率密度関数 ƒ とカーネル関数 K に関する弱い仮定から次が得られる。

理論的リスク関数を最小化することで、最適なバンド幅は以下のように示される。

ここで



である。最適なバンド幅を選択したとき、リスク関数は であり c4 > 0 はある定数である。弱い仮定の下で、カーネル推定器より早く収束するノンパラメトリックな推定器は存在しないことが示される。なお、n−4/5 という収束レートは、パラメトリックな手法での典型である n−1 という収束レートよりも遅い。

実装例

  • MATLAB - カーネル密度推定は ksdensity 関数で実装されている。
  • Origin - 2Dカーネル密度プロットがユーザーインターフェースより作画できるほか、Ksdensity(1D用)とKs2density(2D用)の両関数がLabTalk言語PythonC言語からアクセス可能である。
  • PAST - Plot項目の中のHistogramで,カーネル曲線が描ける。
  • R言語 - density 関数で実装されている。
  • Stata - kdensity で実装されている。例えば、histogram x, kdensity
  • SAS - proc kde は1変量または2変量のカーネル密度推定に使われる。

脚注

[ヘルプ]

参考文献

関連項目

外部リンク




英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

カテゴリ一覧

すべての辞書の索引



Weblioのサービス

「カーネル密度推定」の関連用語











カーネル密度推定のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



カーネル密度推定のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのカーネル密度推定 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2025 GRAS Group, Inc.RSS