シンプソン自身が提示した例
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/14 08:01 UTC 版)
「シンプソンのパラドックス」の記事における「シンプソン自身が提示した例」の解説
シンプソン自身が提示した例では、関連性の逆転はみられない。 トランプの52枚のカードについて、絵札かどうか(ジャック、クイーン、キングのいずれかかどうか)と色(スペードとクラブなら黒、ハートとダイヤなら赤)との関連を考える。赤ちゃんがこのトランプで遊んでいたので、そのうち20枚ほどが汚れている。汚れたカードだけみても汚れていないカードだけみても、絵札以外の方が、赤いカードである可能性が高いことが分かった。では「絵札以外の方が、赤いカードである可能性が高い」と結論づけていいのか?カード全体を見渡して考えることで「分別のある解答」(sensible answer) が得られる。すなわち、そのような関係はない。 汚れたカード絵札絵札以外赤4/52 8/52 黒3/52 5/52 汚れていないカード絵札絵札以外赤2/52 12/52 黒3/52 15/52 カード全体絵札絵札以外赤6/52 20/52 黒6/52 20/52 とある治療の有無と生存との関連を、男女別に検討する。出てくる数字はトランプの例と全く同じだ。男女別で調べると、治療した方が生存率が高いことが分かる。しかし、男女合わせたら治療の有無と生存との関連がなくなってしまう。「分別のある解釈」(sensible interpretation) はどうなるだろうか?この治療が無効とされることはまずないだろう。 男性治療なし治療あり生存4/52 8/52 死亡3/52 5/52 女性治療なし治療あり生存2/52 12/52 死亡3/52 15/52 対象集団全体治療なし治療あり生存6/52 20/52 死亡6/52 20/52 この例に対し、Miguel Hernán(英語版) は、Simpson 自身の記述の曖昧さを指摘しつつも、以下のような解釈を与えている。 トランプの例では、汚れの有無 (C) は絵札か否か (A) とカードの色 (B) の共通の結果、すなわち合流点である。 A → C ← B {\displaystyle A\rightarrow C\leftarrow B} 治療の例では、性別 (C) は治療の有無 (A) と生死 (B) の共通の原因、すなわち交絡因子である。 A ← C → B {\displaystyle A\leftarrow C\rightarrow B} トランプの例では、合流点による選択バイアスを避けるためにカード全体を見渡すべきだし、治療の例では、交絡を避けるために性別で層別化して考えるべきだ。ただし、CがAと関係せずにBの原因となるとき、例えば無作為割付がなされた場合には、層別化する必要はない。因果関係の方向性に基づいて解析手法を検討するが、因果関係の方向についてはそのテーマに関する因果構造の知識が必要である。トランプのカードが汚れたから(C)といって絵札になったり(A)赤のカードになったり(B)することはないし、治療したから(A)とか生存したから(B)といって男性になる(C)ようなことはない。 そして、次のように結論づけている。 同じデータであっても異なる因果構造に起因するものであれば異なる解析が必要である。 実りのある因果推論を行うためには、統計学だけではなく、主題に関する因果関係の知識が必要だ。
※この「シンプソン自身が提示した例」の解説は、「シンプソンのパラドックス」の解説の一部です。
「シンプソン自身が提示した例」を含む「シンプソンのパラドックス」の記事については、「シンプソンのパラドックス」の概要を参照ください。
- シンプソン自身が提示した例のページへのリンク