多重代入法
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/12/17 05:40 UTC 版)
代入によるノイズの増加の問題に対処するために、Rubin(1987) は、複数の代入したデータセット間の結果を平均化する方法を開発した。 多重代入法は次の 3 つのステップに従う。 代入 – 単一代入法と同様、欠測データが代入される。 ただし、代入値は、1回だけではなく、分布から m {\displaystyle m} 回抽出される。 このステップの終了時には、 m {\displaystyle m} 個の代入済みデータセットが存在する。 分析 – m {\displaystyle m} 個の代入済みデータセットのそれぞれが独立に分析される。 このステップの終了時には、 m {\displaystyle m} 個の分析が存在する。 プーリング – 関心のある変数の平均、分散、信頼区間を計算する 、すなわち各のモデルからのシミュレーションを組み合わせることにより、 m {\displaystyle m} 個の結果が1つの結果に統合される。 単一代入法の手法が複数あるのと同様に、多重代入法の手法も複数ある。多重代入法が単一代入法およびリストワイズ削除よりも優れている1つの利点は、複数の代入が柔軟であり、さまざまなシナリオで使用できることである。欠測が完全に無作為である場合(MCAR)や欠測が無作為である場合(MAR)だけでなく、欠測が無作為ではない場合(MNAR)であっても、多重代入法を用いることができる。マルコフ連鎖モンテカルロ法 multiple imputation by chained equations(MICE)が多重代入法ではよく用いられる手法で、fully conditional specification(FCS)や逐次回帰多重代入とも呼ばれる 。MICEは、欠測が無作為である(MAR)データセットに非常にうまく機能することが示されているが、シミュレーション研究を通じて、十分な数の補助変数または潜在変数(潜在クラス分析法により導出)を用いることで、欠測が無作為ではない(MNAR)データセットでも機能することが示唆されている 。 単一代入法では代入の不確実性を考慮しておらず、代入後にはデータが実際の値であるかのように扱われる。代入の不確実性を無視することで、結果のバラツキを過小評価したり、誤った結論に至る可能性がある 。多重代入法では、複数回代入することによって、不確実性と真の値がとったであろう範囲とを記述することができる。 さらに、単一代入法とリストワイズ削除の実装が簡単な場合もあるが、多重代入法の実装もそれほど難しくはない。多重代入法を簡単に実行できるような多様な統計パッケージが多様な統計ソフトウェアに実装されている。たとえば、MICEパッケージを使用すると、RのユーザーはMICEメソッドを使用して多重代入を実行できる。
※この「多重代入法」の解説は、「代入法 (統計学)」の解説の一部です。
「多重代入法」を含む「代入法 (統計学)」の記事については、「代入法 (統計学)」の概要を参照ください。
- 多重代入法のページへのリンク