小標本の例
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/03/22 22:48 UTC 版)
例として、サイズ 6 の無作為標本を考える。この場合の標本中央値は、通常、3 番目と 4 番目の順序統計量で区切られた区間の中点として定義される。しかしこれまでの議論から、この区間が実際に母集団中央値を含む確率は次のようになる: ( 6 3 ) 2 − 6 = 5 16 ≈ 31 % {\displaystyle {6 \choose 3}2^{-6}={5 \over 16}\approx 31\%} 標本中央値は、母集団中央値のおそらく分布に依存しない最良の点推定であるが、絶対的な意味で特に優れているわけではないことを、この例は表している。母集団中央値のより良い信頼区間は、この例の場合、2 番目と 5 番目の順序統計量で囲まれた区間であり、母集団中央値を含む確率は次のようになる: [ ( 6 2 ) + ( 6 3 ) + ( 6 4 ) ] 2 − 6 = 25 32 ≈ 78 % {\displaystyle \left[{6 \choose 2}+{6 \choose 3}+{6 \choose 4}\right]2^{-6}={25 \over 32}\approx 78\%} このように小さな標本サイズでは、もしも少なくとも 95% の信頼度が欲しければ、確率 31/32 つまり約 97% で 6 個の観測値の最小値と最大値の間にある、と表現することになってしまう。サイズ 6 は、最小値と最大値で決まる区間が、少なくとも 95% 信頼区間になるような最小の標本サイズである。 もしも分布が対称であることがわかっていて、分散が有限ならば(例えば正規分布のような場合)、母集団の平均値は中央値に等しく、標本平均値は標本中央値よりもかなり良い信頼区間を持つ。これは、分布に依存しない統計的方法の相対的弱点を表している。他方において、もしも間違った分布に立脚した方法を用いると、推定に大きな系統的誤差が生じてしまう可能性もある。
※この「小標本の例」の解説は、「順序統計量」の解説の一部です。
「小標本の例」を含む「順序統計量」の記事については、「順序統計量」の概要を参照ください。
- 小標本の例のページへのリンク