確率密度関数

例えば単変数の確率密度関数を平面上のグラフに表現して、x軸に確率変数の値を、y軸に確率密度を採った場合、求めたい範囲(x値)の下限値と上限値での垂直線と、変数グラフ曲線と y = 0 の直線とで囲まれる範囲の面積が確率になる。
「確率分布関数」 (probability distribution function)[1] あるいは「確率関数」 (probability function)[2] という用語は、具体的に何を指しているか現時点でも定義が曖昧であり、確率論研究者や統計学者の間では、その意味が標準的でないとされる場合がある。
他の資料に拠れば「確率密度関数」は値の集合に対する関数として定義されたり、累積分布関数との関係で言及されたり、確率質量関数の意味で使われたりする。さらには、密度関数 (density function) という用語が確率質量関数の意味で用いられている場合もある[3]。
例
例として、寿命が4〜6時間程度のバクテリアがいると仮定する。この時、特定のバクテリアが丁度 5時間で死亡する確率はどれ位だろうか? 答えは0%である。およそ5時間で寿命を迎えるバクテリアはたくさん居るが、正確に5.0000000000…時間で死ぬことはない。
一方で、5〜5.01時間で死亡する確率はどうだろうか? 例えば、これが2%だとする。では、その1/10の範囲の5〜5.001時間である確率は? 答えはおよそ 2% × 1/10 = 0.2% となる。さらにその 1/10 の範囲の5〜5.0001時間である確率は、およそ0.02%である。
上記の3例において、『「特定の時間範囲内に死亡する確率」を「その範囲の長さ」で割った値』に着目すると、1時間につき 2 に定まることが分かる。例えば、5〜5.01時間の0.01時間の範囲でバクテリアが死亡する確率は0.02であり、確率 0.02 ÷ 0.01時間 = 2時間−1 である。この2時間−1(毎時200%)という量を、5時間時点での確率密度と呼ぶ。
従って、「バクテリアの寿命が5時間である確率」を問われた時、真の答えは0%であるが、より実用的には、2時間−1 dt であると言える。これは、無限小の時間範囲 dt 内で、バクテリアが死亡する確率である。例えば、丁度5時間〜5時間 + 1ナノ秒の寿命である確率は、2時間−1 × 1ナノ秒 ≈ 6 × 10−13 である。
これを確率密度関数 f を用いて、f(5時間)= 2時間−1 と表現することができる。f を任意の時間範囲(微小に限らない)で積分することで、当該時間範囲内でバクテリアの寿命が尽きる確率を求めることができる。
絶対連続確率分布での定義
絶対連続確率分布では確率密度関数が存在する。確率変数 X の確率密度関数 fX を考え、fX が非負のルベーグ可積分な関数であるとする。ここで、
- 確率密度のページへのリンク