内部スチューデント化と外部スチューデント化
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/04/11 01:18 UTC 版)
「スチューデント化残差」の記事における「内部スチューデント化と外部スチューデント化」の解説
σ2 の推定量は σ ^ 2 = 1 n − m ∑ j = 1 n ε ^ j 2 {\displaystyle {\widehat {\sigma }}^{2}={1 \over n-m}\sum _{j=1}^{n}{\widehat {\varepsilon }}_{j}^{2}} で表される。ここで m はモデルの母数の個数 (この例では 2)である。 i 番のデータが「外れ値」かどうかを検討する時には、i番の観測を分散の推定には用いないことが望ましい。結局、以下の推定量が用いられる。 σ ^ ( i ) 2 = 1 n − m − 1 ∑ j = 1 j ≠ i n ε ^ j 2 , {\displaystyle {\widehat {\sigma }}_{(i)}^{2}={1 \over n-m-1}\sum _{\begin{smallmatrix}j=1\\j\neq i\end{smallmatrix}}^{n}{\widehat {\varepsilon }}_{j}^{2},} ここで総和記号Σは i 番の観測を除くすべての観測に基づく和である。後者の推定量を用いる場合、i 番の観測は「除外された」ので、「外部スチューデント化残差」 (externally studentized residual)または「削除後スチューデント残差」 (deleted studentized residual) という。前者を用いる場合、i 番の観測を「含んだ」ので、「内部スチューデント化残差」 (internally studentized residual) という。 誤差が独立で、期待値 0 で 分散 σ2 の 正規分布に従う場合、i 番の外部スチューデント化残差の確率分布はスチューデントのt分布となる。その自由度は n − m − 1 であり、値域は (-∞, +∞) である。 一方、内部スチューデント化残差の値域は 0 ± r . d . f . {\displaystyle 0\pm {\sqrt {\mathrm {r.d.f.} }}} である。ここで自由度は残差の自由度すなわち n − m である。"i.s.r" で内部スチューデント化残差を表し、誤差は独立同一正規分布 (independent identically distributed Gaussian) 変数と仮定すると、 i . s . r . 2 = r . d . f . t 2 t 2 + r . d . f . − 1 {\displaystyle \mathrm {i.s.r.} ^{2}=\mathrm {r.d.f.} {t^{2} \over t^{2}+\mathrm {r.d.f.} -1}} ここで t はt分布でその自由度は r.d.f. − 1 である。実は、上式は i.s.r.2/r.d.f. がベータ分布に従うことを示す。r.d.f. = 3 のとき、内部スチューデント化残差は − 3 {\displaystyle -{\sqrt {3}}} and + 3 {\displaystyle +{\sqrt {3}}} で一様分布する。 自由度が 1 しかない場合、内部スチューデント化残差を表す上式は適用できない。この場合、内部スチューデント化残差は +1 か -1 のどちらかにそれぞれ 50 パーセントの確率で分布する。
※この「内部スチューデント化と外部スチューデント化」の解説は、「スチューデント化残差」の解説の一部です。
「内部スチューデント化と外部スチューデント化」を含む「スチューデント化残差」の記事については、「スチューデント化残差」の概要を参照ください。
- 内部スチューデント化と外部スチューデント化のページへのリンク