正規分布 参考文献

正規分布

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/08/21 06:41 UTC 版)

正規分布
確率密度関数
正規分布の確率密度関数。赤は標準正規分布
累積分布関数
正規分布の累積分布関数:色は確率密度関数と同じ
母数

また、多変量の統計として共分散まで込めた多次元の正規分布も定義され、平均 μ = (μ1, μ2, …, μn)n 次元正規分布の同時密度関数は次の式で与えられる。

歪正規分布の確率密度関数

正規分布の拡張としては、上で示した多次元化を施した多変量正規分布の他に、歪正規分布 (Skew-Normal (SN) distribution) がある。これは三変数で表現され、そのうち1つの変数について α = 0 のときに正規分布となることから、分布を平均と分散の二変数で表現する正規分布の拡張であるといえる。φ(x) を標準正規分布の確率密度関数とする。

標準正規分布がもつ確率密度関数のグラフ

正規分布 N(μ, σ2) からの無作為標本 x を取ると、平均 μ からのずれが ±1σ 以下の範囲に x が含まれる確率は 68.27%、±2σ 以下だと 95.45%、さらに ±3σ だと 99.73% となる[1]

正規分布は、t分布F分布といった種々の分布の考え方の基礎になっているだけでなく、実際の推測統計学においても、仮説検定区間推定など、様々な場面で利用される。

正規分布 N(μ, σ) に従う確率変数 X が与えられたとき Z = Xμ/σ と標準化すれば確率変数 Z は標準正規分布に従う。大学レベルの統計入門のクラスでは必ず行われているが、Z 値を求めることで標準正規分布表と呼ばれる変量に対応した確率を表す一覧表を用いて、コンピュータを使うことなく正規分布に従った事象の確率を求めることができる。

不連続値をとる確率変数についての検定の場合でも、連続変数と同様の考え方で正規分布を近似的に用いることがある。これは標本の大きさ n が大きく、かつデータの階級幅が狭いほど、近似の精度が高い。

標準正規分布における信頼度の推移
標準正規分布におけるσ区間の推移
信頼区間に対する信頼度の推移
信頼区間 信頼度 危険率
百分率 百分率
0.318 639σ 25% 75% 3/4
0.674490σ 50% 50% 1/2
0.994458σ 68% 32% 1/3.125
1σ 68.2689492% 31.7310508% 1/3.1514872
1.281552σ 80% 20% 1/5
1.644854σ 90% 10% 1/10
1.959964σ 95% 5% 1/20
2σ 95.4499736% 4.5500264% 1/21.977895
2.575829σ 99% 1% 1/100
3σ 99.7300204% 0.2699796% 1/370.398
3.290527σ 99.9% 0.1% 1/1000
3.890592σ 99.99% 0.01% 1/10000
4σ 99.993666% 0.006334% 1/15787
4.417173σ 99.999% 0.001% 1/10,0000
4.5σ 99.9993204653751% 0.0006795346249% 1/14,7159.5358
4.891638σ 99.9999% 0.0001% 1/100,0000
5σ 99.9999426697% 0.0000573303% 1/174,4278
5.326724σ 99.99999% 0.00001% 1/1000,0000
5.730729σ 99.999999% 0.000001% 1/1,0000,0000
6σ 99.9999998027% 0.0000001973% 1/5,0679,7346
6.109410σ 99.9999999% 0.0000001% 1/10,0000,0000
6.466951σ 99.99999999% 0.00000001% 1/100,0000,0000
6.806502σ 99.999999999% 0.000000001% 1/1000,0000,0000
7σ 99.9999999997440% 0.000000000256% 1/3906,8221,5445

正規分布の適用

自然界の事象の中には正規分布に従う数量の分布をとるものがあることが知られている[11]。また、そのままでは変数が正規分布に従わない場合もその対数をとると正規分布に従う場合がある。

正規分布が統計学上特別な地位を持つのは中心極限定理が存在するためである。中心極限定理は、「独立な同一の分布に従う確率変数の算術平均(確率変数の合計を変数の数で割ったもの)の分布は、元の確率変数に標準偏差が存在するならば、元の分布の形状に関係なく、変数の数が多数になったとき、正規分布に収束する」というものである[1]。このため大標本の「平均値」の統計には、正規分布が仮定されることが非常に多い。なお、「独立な同一の分布に従う確率変数の値」自身は、標本数をどれだけ増やしても、元の分布に従うだけで、正規分布に収束することはない。(一つのサイコロを振ったときの目の分布は、サイコロをどれだけ多く振っても、1から6の均等分布である。正規分布に収束するのは、出た目の平均値の分布である。)

前述のごとく自然界の事象の中には、正規分布に従う数量の分布をとるものがあることが知られている。しかしそれは必ずしも多数派というわけではない。19世紀ではさながら「正規分布万能主義」といったものがまかり通っていたが、20世紀以降そういった考え方に修正が見られた。今日においては社会現象、生物集団の現象等々、種別から言えば、正規分布に従うものはむしろ少数派であることが確認されている。例えば、フラクタルな性質を持つ物は正規分布よりも、パレート分布になることが多い。人間は自然界の事象とは違って自分の意思をもっているため、たとえば、子供の成績などは決して正規分布にはならない[11]。しかし、そもそも理論上、正規分布の x の値は負の無限大から正の無限大まで取れるのに対して、多くの事象は最小値(例えば比例尺度におけるゼロ)と最大値(例えばテストにおける100点満点)が予め定まっている場合があり、そのような事象が完全な正規分布に従うとするには無理がある(その際はcensoringつまり打ち切りを考慮したり、対数正規分布を用いたりするとより正確な確率を求めることが出来る場合がある)。また、0 および自然数しかとらない離散確率分布、例えばポアソン分布二項分布連続確率分布である正規分布で近似することも一般的に行われている。

検定

正規Q-Qプロット

何らかの事象について法則性を捜したり理論を構築しようとしたりする際、その確率分布がまだ分かっていない場合にはそれが正規分布であると仮定して推論することは珍しくないが、誤った結論にたどりついてしまう可能性がある。標本データが正規分布に近似しているかどうを判断するためには、尖度歪度を調べる、ヒストグラムを見る、正規Q-Qプロットをチェックする、あるいはシャピロ–ウィルク検定コルモゴロフ–スミルノフ検定(正規分布)を利用する方法などが一般的に行われている。

点推定

平均や分散が未知の正規分布に従うデータから、母数 θ = (μ, σ2) を推定したいことがある。これには次の推定量

出典は列挙するだけでなく、脚注などを用いてどの記述の情報源であるかを明記してください。 記事の信頼性向上にご協力をお願いいたします。2016年4月

関連項目

外部リンク





正規分布と同じ種類の言葉


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「正規分布」の関連用語

正規分布のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



正規分布のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの正規分布 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2024 GRAS Group, Inc.RSS