階層データのその他の分析手法
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/11 08:22 UTC 版)
「マルチレベルモデル」の記事における「階層データのその他の分析手法」の解説
階層データの分析にはいくつかの方法があるが、そのほとんどに問題がある。 まず、従来の統計手法に基づき、高次の変数を個人のレベルに分解して個人のレベルで分析する(クラス変数を個々に割り当てる)ことが考えられる。この方法の問題点は、独立性の仮定を破ることになり、結果に偏りが生じる可能性があることである。これは原子論的誤謬(atomistic fallacy)と呼ばれる。 従来の統計的アプローチによるもう一つの方法として、個人のレベルの変数を高次の変数に集約し、その高次のレベルで分析を実行することが考えられる。この手法では、個人レベルの変数の平均を取るため、グループ内の情報が全て捨てられてしまうことになる。80〜90%もの分散が無駄になり、集約された変数間の関係が膨らみ、その結果、歪んだものになる。これは生態学的誤謬(ecological fallacy)と呼ばれ、統計的には、情報の損失に加えて検出力の低下をもたらす。 階層データを分析するもう一つの方法は、ランダム係数モデルを使用することである。このモデルは、各グループがそれぞれの切片と傾きを持つ異なる回帰モデルを持っていると仮定する。グループはサンプリングされるので、このモデルでは、切片と傾きもグループの切片と傾きの母集団から無作為に抽出されると仮定する。これにより、傾きは固定されているが切片は変化させることができると仮定して分析することができる。しかし、これには問題がある。個人成分や独立しているが、グループ成分はグループ間で独立しているだけでグループ内で依存しているからだ。また、傾きはランダムだが、誤差項の相関は個人レベルの変数の値に依存するという分析も可能である。このように、階層データを分析するためにランダム係数モデルを使用する場合、高次の変数を組み込むことができないという問題がある。
※この「階層データのその他の分析手法」の解説は、「マルチレベルモデル」の解説の一部です。
「階層データのその他の分析手法」を含む「マルチレベルモデル」の記事については、「マルチレベルモデル」の概要を参照ください。
- 階層データのその他の分析手法のページへのリンク