標本分散・不偏標本分散
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/01 05:00 UTC 版)
「分散 (統計学)」の記事における「標本分散・不偏標本分散」の解説
大きさが n である標本 x1, x2, …, xn に対して、平均値を x で表すとき、偏差の自乗の平均値 s 2 = 1 n ∑ i = 1 n ( x i − x ¯ ) 2 {\displaystyle s^{2}={\frac {1}{n}}\textstyle \sum \limits _{i=1}^{n}(x_{i}-{\bar {x}})^{2}} で定義される s2 を標本分散(ひょうほんぶんさん、英: sample variance)と言う。s は標準偏差と呼ばれる。 定義より、 s 2 = 1 n ∑ i = 1 n x i 2 − ( x ¯ ) 2 = x 2 ¯ − ( x ¯ ) 2 {\displaystyle s^{2}={\frac {1}{n}}\textstyle \sum \limits _{i=1}^{n}{x_{i}}^{2}-({\bar {x}})^{2}={\overline {x^{2}}}-({\bar {x}})^{2}} となるから、標本分散は、2乗の平均値と平均値の2乗との差に等しい。従って、ただし、この計算では、概して二乗平均が巨大になるため、浮動小数点数による近似計算を行う場合には大きな丸め誤差が生じる可能性がある(桁落ち)。このため、浮動小数点数を扱う場合には定義に従って偏差の二乗和を計算することが一般的である(あるいは一般の総和計算と同じくカハンの加算アルゴリズムやpairwise summation(英語版)のような手法により、誤差を小さくする工夫が為されることもある)。 一般に、標本分散の平均値は母分散より少し小さくなる。実際には、平均と分散を持つ同一分布からの無作為標本に対して E [ s 2 ] = ( 1 − 1 n ) σ 2 {\displaystyle E[s^{2}]=\left(1-{\frac {1}{n}}\right)\sigma ^{2}} が成り立つ。そこで σ ^ 2 = 1 n − 1 ∑ i = 1 n ( x i − x ¯ ) 2 = 1 n − 1 ∑ i = 1 n x i 2 − n n − 1 x ¯ 2 {\displaystyle {\hat {\sigma }}^{2}={\frac {1}{n-1}}\textstyle \sum \limits _{i=1}^{n}(x_{i}-{\bar {x}})^{2}={\dfrac {1}{n-1}}\sum \limits _{i=1}^{n}{x_{i}}^{2}-{\dfrac {n}{n-1}}{\bar {x}}^{2}} を用いると、平均値が母分散に等しくなる推定量が得られる。つまり母分散の不偏推定量となる。これを不偏標本分散(ふへんひょうほんぶんさん、英: unbiased sample variance)や不偏分散(ふへんぶんさん、英: unbiased variance)と呼ぶ。 上記の標本分散は不偏でないことを強調する場合偏りのある標本分散(英: biased sample variance)と言う。 「偏り」も参照 なお、不偏標本分散を単に標本分散と呼ぶ文献もある。 定義から明らかに、標本の大きさが大きくなる程につれて偏りのある標本分散は不偏標本分散に近づく。
※この「標本分散・不偏標本分散」の解説は、「分散 (統計学)」の解説の一部です。
「標本分散・不偏標本分散」を含む「分散 (統計学)」の記事については、「分散 (統計学)」の概要を参照ください。
- 標本分散不偏標本分散のページへのリンク