分散拡大係数分散拡大係数の概要

定義

以下の k 個の独立変数を持った線形モデル(linear model)を考える。

Y = β₀ + β₁ X₁ + β₂ X ₂ + ... + β_k X_k + ε.

推定値 β_j の標準誤差は s²(X^′X)⁻¹ の j+1, j+1 要素の平方根である。ここで、 s は2乗平均平方根誤差（RMSE）である(RMSE² は誤差項の真の分散 $\sigma ^{2}$ の一致推定量である)。X は計画行列である。β_j の推定量の分散は次式で表される。

{\rm {\widehat {var}}}({\hat {\beta }}_{j})={\frac {s^{2}}{(n-1){\widehat {\rm {var}}}(X_{j})}}\cdot {\frac {1}{1-R_{j}^{2}}},

ここで、R_j² は、他の共変量に対する X_j の回帰における決定係数である(目的変数の Y は回帰に含めない)。これにより、係数推定の分散に関していくつかの因子の影響を分離する。

s²: 回帰面のデータの散らばりが大きくなると、係数の推定値の分散が大きくなる。
n: サンプルサイズが大きくなると、係数の推定値の分散が小さくなる。
${\widehat {\rm {var}}}(X_{j})$ : 共変量の分散が大きいと、係数の推定値の分散が小さくなる。

残りの項の 1 / (1 − R_j²) が VIF である。係数の推定の不確かさに影響を与えるほかのすべての因子を反映している。ベクトル X_j が他の共変量に対する X_j の回帰における計画行列の各々の列に対して直交しているとき、 VIF が 1 となる。そうでない場合は、1 より大きくなる。VIF は変量のスケールに対して不変である(VIFを変えずに、定数 c_j によって X_j のスケーリングが可能)。

計算と分析

以下の3ステップにより、k 個の VIF を計算することができる。

ステップ1

最初に、X_iを目的変数とし、他の変数を説明変数とした最小二乗回帰を行う。 _i = 1 であれば、以下のような等式となる。

X_{1}=\alpha _{2}X_{2}+\alpha _{3}X_{3}+\cdots +\alpha _{k}X_{k}+c_{0}+e

ここで、c₀ は定数であり、e は誤差である。

ステップ2

次式により、 ${\hat {\beta }}_{i}$ に対する VIF ファクターを計算する。

\mathrm {VIF_{i}} ={\frac {1}{1-R_{i}^{2}}}

ここで、R²_i はステップ1における回帰の決定係数である。

ステップ3

$\operatorname {VIF} ({\hat {\beta }}_{i})$ の大きさを考慮し、多重共線性の程度を分析する。経験的に、 $\operatorname {VIF} ({\hat {\beta }}_{i})>10$ であれば多重共線性の程度は大きい。ソフトウェアによっては、VIFの逆数である許容誤差を計算する。

[前の解説]

[続きの解説]

「分散拡大係数」の続きの解説一覧

1 分散拡大係数とは
2 分散拡大係数の概要
3 解釈

分散拡大係数 分散拡大係数の概要