適切な操作変数の選択
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/11/09 10:09 UTC 版)
U {\displaystyle U} は観測できないので、 Z {\displaystyle Z} が U {\displaystyle U} から独立であるという仮定が満たされるかどうかはデータからは導かれず、かわりにモデルの構造、つまりデータの生成過程を決定しなくてはならない。因果のグラフはこの構造を表現していて、上で与えられているグラフの定義は変数 Z {\displaystyle Z} が共変数 W {\displaystyle W} が与えられた下で操作変数として機能するかどうかを手早く決めるために用いることが出来る。この点を見るために、以下の例を考えよう。 図2: G X ¯ {\displaystyle G_{\overline {X}}} 。 これは場所の近さ(Proximity)が操作変数かどうかを決定するために用いられる。 ランダムに学生が寮に割り当てられるような大学において、大学のチュータープログラム(Tutoring Program)がGPAに与える影響を推定したいとしよう。チュータープログラムへの出席とGPAの間の関係は数多くの要因によって混同される。チュータープログラムに出席した学生は自分の成績に注意を払うかもしれないし、努力をするかもしれない(この混同は図.1-3における右側のチュータープログラムとGPAの間の双方向に伸びる弧を通して描写される)。学生が寮にランダムに割り当てられたとして、チュータープログラムが行われる場所からの学生の寮の近さは操作変数の自然な候補になる。 しかしながら、チュータープログラムが大学の図書館で行われたらどうなるだろうか。チュータープログラムが行われる場所と寮の近さは学生がより図書館で時間を費やそうとする原因になりうるだろうし、今度はそれがGPAを改善するだろう(図1を参照)。図2において描写されている因果グラフを用いると、チュータープログラムの行われる場所の近さは、グラフ G X ¯ {\displaystyle G_{\overline {X}}} において「場所の近さ(Proximity) → {\displaystyle \rightarrow } 図書館の使用時間(Library Hours) → {\displaystyle \rightarrow } GPA」という経路を通してGPAと繋がっているため、操作変数としてはふさわしくない。しかしながら、共変数として図書館の使用時間を加えてコントロールすれば、 G X ¯ {\displaystyle G_{\overline {X}}} において図書館の使用時間が与えられた下で場所の近さはGPAから分離されるため、場所の近さは操作変数になる。 今、図3のように学生"そのものが持つ能力"(Ability)が学生のGPAと同じくらい学生の図書館にいる時間に影響を与えるとしよう。因果グラフを用いれば、図書館の使用時間はコライダーとなり、図書館で条件付けることは「場所の近さ(Proximity) → {\displaystyle \rightarrow } 図書館の使用時間(Library Hours) ↔ {\displaystyle \leftrightarrow } GPA」という経路を作るだろう。結果として、場所の近さは操作変数として用いることは出来ない。 最後に、図4で示されているように、図書館で勉強しない学生は単に他の場所で勉強するので、図書館の使用時間はGPAに何の影響も与えないとしよう。この場合、図書館の使用時間を制御することは場所の近さからGPAまでの信用できない経路を開く。しかしながら、図書館の使用時間をコントロールせず、共変数から除外すると、場所の近さは操作変数として用いることが出来る。
※この「適切な操作変数の選択」の解説は、「操作変数法」の解説の一部です。
「適切な操作変数の選択」を含む「操作変数法」の記事については、「操作変数法」の概要を参照ください。
- 適切な操作変数の選択のページへのリンク