傾向スコア・マッチング
傾向スコア・マッチング(プロペンシティ・スコア・マッチング、propensity score matching、PSM)は、観察データの統計分析の分野において、治療を受けることを予測する共変量を考慮して、処置(treatment)、方針、その他介入の効果を推定しようとするマッチング手法。処置を受けた人々と受けなかった人々の結果を単純に比較して治療効果を推定すると交絡変数によるバイアス(偏り)が発生する。このバイアスを軽減するための手法が傾向スコア・マッチングであり、1983年、ポール・ローゼンバウムとドナルド・ルービンが発表した [1]。
処置群とコントロール群(非処置群)の処置結果(平均処置効果など)の違いは、処置そのものではなく処置を予測する要因によって引き起こされる可能性があり、その場合はバイアスが発生する。ランダム化比較試験では、無作為割り付けによってバイアスなく処置効果を推定することができる。無作為割り付けによって、各共変量のバランスが取れることを大数の法則が保証する。残念ながら、観察研究の多くで、処置の無作為割り付けはなされていない。マッチングでは、観察された共変量が同じくらいの標本を処置群とコントロール群のそれぞれから抽出することにより、割り付けバイアスを減らして、無作為割り付けに近いものにする。
たとえば、喫煙の影響を知りたい場合を考える。人々を喫煙群に無作為に割り付けることは非倫理的であるため、観察研究が必要である。喫煙群と非喫煙群とを単純に比較することによって処置効果を推定すると、喫煙率に影響する要因(性別や年齢など)によるバイアスが生じる。傾向スコア・マッチングでは、処置群とコントロール群の制御変数(この例では性別や年齢など)を同じくらいにすることによって、これらのバイアスを制御することを目指す。
概要
傾向スコア・マッチングは、以下の様な非実験的設定における因果推論および選択バイアスに対して使用される。
- コントロール群には、処置群の被験者と同等といえる被験者がほとんどいない
- 高次元の特徴量を元に比較する必要があるため、処置群の被験者とよく似たコントロール群の被験者を選択することが難しい
通常のマッチングでは、治療群と対照群を区別する単一の特性が照合される。ただし、2つのグループに実質的な重複がない場合は、かなりの誤差が発生する可能性がある。たとえば、コントロール群の最悪のケースと処置群の最良のケースとの比較になってしまうと、平均への回帰によって、実際よりも良く見えたり悪く見えたりする可能性がある。
傾向スコア・マッチングでは割り付けの予測確率(たとえば、処置群とコントロール群のどちらに割り付けられるかの確率)を採用する。この予測確率は、観測された予測因子に基づいたロジスティック回帰によって取得されることが多く、反実仮想群を作成することができる。傾向スコアは、単独または他のマッチング変数または共変量と一緒に、マッチングに使ったり共変量として扱ったりすることができる
一般的な手順
1. ロジスティック回帰を実行する
- 従属変数:治療群では
カテゴリ
- 傾向スコア・マッチングのページへのリンク