解釈と「二重ロバスト性」
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/04 14:06 UTC 版)
「逆確率重み付け」の記事における「解釈と「二重ロバスト性」」の解説
式を並べ替えると、根本的なアイデアが明らかになる。推定量は、モデルを用いて予測されたアウトカムの平均値(下記)に基づいている。 1 n ∑ i = 1 n ( Q ^ n ( X i , a ) ) {\displaystyle {\frac {1}{n}}\sum _{i=1}^{n}{\Biggl (}{\hat {Q}}_{n}(X_{i},a){\Biggr )}} しかし、モデルにバイアスがある場合、モデルの残差は0付近にはならない。モデル Q の平均残差の項を追加することにより、この潜在的なバイアスを修正できる。 1 n ∑ i = 1 n 1 A i = a p ^ n ( A i ∣ X i ) ( Y i − Q ^ n ( X i , a ) ) {\displaystyle {\frac {1}{n}}\sum _{i=1}^{n}{\frac {1_{A_{i}=a}}{{\hat {p}}_{n}(A_{i}\mid X_{i})}}\left(Y_{i}-{\hat {Q}}_{n}(X_{i},a)\right)} Yの値が欠落しているため、各残差の相対的な重要性を膨らませるために重みを付ける(これらの重みは、各被験者の観測値を見る逆の傾向、別名確率に基づく)( 10ページを参照)。 「二重ロバスト性」は、推定量が不偏であるためには、 Q ^ n ( X i , a ) {\displaystyle {\hat {Q}}_{n}(X_{i},a)} および p ^ n ( A i ∣ X i ) {\displaystyle {\hat {p}}_{n}(A_{i}\mid X_{i})} という 2つのモデルのうち、いずれかが正しく規定されていれば十分であるという事実に由来する。これは、アウトカムモデルが適切に規定されていれば、その残差は(重み付けに関係なく)0付近になるためである一方、モデルが不偏でなくても、重み付けモデルが適切に規定されている場合、そのバイアスは重み付け平均残差によって適切に推定(および補正)される 。 二重ロバスト推定量のバイアスは2次バイアスと呼ばれ、 1 p ^ n ( A i ∣ X i ) − 1 p n ( A i ∣ X i ) {\displaystyle {\frac {1}{{\hat {p}}_{n}(A_{i}\mid X_{i})}}-{\frac {1}{p_{n}(A_{i}\mid X_{i})}}} と Q ^ n ( X i , a ) − Q n ( X i , a ) {\displaystyle {\hat {Q}}_{n}(X_{i},a)-Q_{n}(X_{i},a)} の積に依存する。この性質により、「十分に大きい」サンプルサイズがある場合、(パラメトリックモデルの代わりに)機械学習推定器を使用して、二重ロバスト推定量の全体的なバイアスを下げることができる。
※この「解釈と「二重ロバスト性」」の解説は、「逆確率重み付け」の解説の一部です。
「解釈と「二重ロバスト性」」を含む「逆確率重み付け」の記事については、「逆確率重み付け」の概要を参照ください。
- 解釈と「二重ロバスト性」のページへのリンク