プラグインアプローチ
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/04/06 07:23 UTC 版)
「カプラン=マイヤー推定量」の記事における「プラグインアプローチ」の解説
基本的な計算によって、 S ( t ) = Prob ( τ > t ∣ τ > t − 1 ) Prob ( τ > t − 1 ) = ( 1 − Prob ( τ ≤ t ∣ τ > t − 1 ) ) Prob ( τ > t − 1 ) = ( 1 − Prob ( τ = t ∣ τ ≥ t ) ) Prob ( τ > t − 1 ) = q ( t ) S ( t − 1 ) , {\displaystyle {\begin{aligned}S(t)&=\operatorname {Prob} (\tau >t\mid \tau >t-1)\operatorname {Prob} (\tau >t-1)\\[4pt]&=(1-\operatorname {Prob} (\tau \leq t\mid \tau >t-1))\operatorname {Prob} (\tau >t-1)\\[4pt]&=(1-\operatorname {Prob} (\tau =t\mid \tau \geq t))\operatorname {Prob} (\tau >t-1)\\[4pt]&=q(t)S(t-1)\,,\end{aligned}}} となり、ここで最後の等式は τ {\displaystyle \tau } が整数値であることを利用し、最終行で q ( t ) = 1 − Prob ( τ = t ∣ τ ≥ t ) . {\displaystyle q(t)=1-\operatorname {Prob} (\tau =t\mid \tau \geq t).} を導いた。 等式 S ( t ) = q ( t ) S ( t − 1 ) {\displaystyle S(t)=q(t)S(t-1)} を再帰的に展開すると、 S ( t ) = q ( t ) q ( t − 1 ) ⋯ q ( 0 ) . {\displaystyle S(t)=q(t)q(t-1)\cdots q(0).} となる。 ここで、 q ( 0 ) = 1 − Prob ( τ = 0 ∣ τ > − 1 ) = 1 − Prob ( τ = 0 ) {\displaystyle q(0)=1-\operatorname {Prob} (\tau =0\mid \tau >-1)=1-\operatorname {Prob} (\tau =0)} となることに注意すること。 カプラン=マイヤー推定量は、各 q ( s ) {\displaystyle q(s)} がデータに基づいて推定され、 S ( t ) {\displaystyle S(t)} の推定量はこれらの推定量の積として得られる「プラグイン推定量」(plug-in estimator)と見なすことができる。 あとは、 q ( s ) = 1 − Prob ( τ = s ∣ τ ≥ s ) {\displaystyle q(s)=1-\operatorname {Prob} (\tau =s\mid \tau \geq s)} をどのように推定するかを指定するだけである。命題1により、 c k ≥ s {\displaystyle c_{k}\geq s} となるような任意の k ∈ [ n ] {\displaystyle k\in [n]} に対して、 Prob ( τ = s ) = Prob ( τ ~ k = s ) {\displaystyle \operatorname {Prob} (\tau =s)=\operatorname {Prob} ({\tilde {\tau }}_{k}=s)} と Prob ( τ ≥ s ) = Prob ( τ ~ k ≥ s ) {\displaystyle \operatorname {Prob} (\tau \geq s)=\operatorname {Prob} ({\tilde {\tau }}_{k}\geq s)} がともに成立する。したがって、 c k ≥ s {\displaystyle c_{k}\geq s} となるような任意の k ∈ [ n ] {\displaystyle k\in [n]} に対して、 Prob ( τ = s | τ ≥ s ) = Prob ( τ ~ k = s ) / Prob ( τ ~ k ≥ s ) . {\displaystyle \operatorname {Prob} (\tau =s|\tau \geq s)=\operatorname {Prob} ({\tilde {\tau }}_{k}=s)/\operatorname {Prob} ({\tilde {\tau }}_{k}\geq s).} となる。 上記のナイーブ推定量の構築と同様の推論により、 q ^ ( s ) = 1 − | { 1 ≤ k ≤ n : c k ≥ s , τ ~ k = s } | | { 1 ≤ k ≤ n : c k ≥ s , τ ~ k ≥ s } | = 1 − | { 1 ≤ k ≤ n : τ ~ k = s } | | { 1 ≤ k ≤ n : τ ~ k ≥ s } | {\displaystyle {\hat {q}}(s)=1-{\frac {|\{1\leq k\leq n\,:\,c_{k}\geq s,{\tilde {\tau }}_{k}=s\}|}{|\{1\leq k\leq n\,:\,c_{k}\geq s,{\tilde {\tau }}_{k}\geq s\}|}}=1-{\frac {|\{1\leq k\leq n\,:\,{\tilde {\tau }}_{k}=s\}|}{|\{1\leq k\leq n\,:\,{\tilde {\tau }}_{k}\geq s\}|}}} という推定量が得られる(「ハザード率」 Prob ( τ = s | τ ≥ s ) {\displaystyle \operatorname {Prob} (\tau =s|\tau \geq s)} の定義において、分子と分母を別々に推定することを考えてみよ)。そして、カプラン=マイヤー推定量は、 S ^ ( t ) = ∏ s = 0 t q ^ ( s ) . {\displaystyle {\hat {S}}(t)=\prod _{s=0}^{t}{\hat {q}}(s).} で与えられる。 記事の冒頭で述べた推定量の形式は、さらにいくつかの代数を用いて得られる。そのためには、 q ^ ( s ) = 1 − d ( s ) / n ( s ) {\displaystyle {\hat {q}}(s)=1-d(s)/n(s)} と記述する。ここで、保険数理の用語を用いて、 d ( s ) = | { 1 ≤ k ≤ n : τ ~ k = s } | {\displaystyle d(s)=|\{1\leq k\leq n\,:\,{\tilde {\tau }}_{k}=s\}|} は時刻 s {\displaystyle s} における既知の死亡者数であり、 n ( s ) = | { 1 ≤ k ≤ n : τ ~ k ≥ s } | {\displaystyle n(s)=|\{1\leq k\leq n\,:\,{\tilde {\tau }}_{k}\geq s\}|} は時刻 s − 1 {\displaystyle s-1} において生存している人の数とする。 なお、 d ( s ) = 0 {\displaystyle d(s)=0} であれば、 q ^ ( s ) = 1 {\displaystyle {\hat {q}}(s)=1} であることに注意を要する。このことは、 S ^ ( t ) {\displaystyle {\hat {S}}(t)} を定義する積から、 d ( s ) = 0 {\displaystyle d(s)=0} の項をすべて除外できることを意味する。そして、 d ( s ) > 0 {\displaystyle d(s)>0} 、 d i = d ( t i ) {\displaystyle d_{i}=d(t_{i})} 、 n i = n ( t i ) {\displaystyle n_{i}=n(t_{i})} の時、 0 ≤ t 1 < t 2 < ⋯ < t m {\displaystyle 0\leq t_{1}<t_{2}<\dots <t_{m}} を時間 s {\displaystyle s} とすると、冒頭に述べたカプラン=マイヤー推定量の形、 S ^ ( t ) = ∏ i : t i ≤ t ( 1 − d i n i ) . {\displaystyle {\hat {S}}(t)=\prod _{i:t_{i}\leq t}\left(1-{\frac {d_{i}}{n_{i}}}\right).} になる。 この推定量は、ナイーブ推定量とは対照的に、利用可能な情報をより効果的に利用していることがわかる。前述の特殊なケースでは、多くの初期イベントが記録されている場合、推定量は1未満の値を持つ多くの項を乗算するため、その結果、生存確率が大きくならないことを考慮に入れよ。
※この「プラグインアプローチ」の解説は、「カプラン=マイヤー推定量」の解説の一部です。
「プラグインアプローチ」を含む「カプラン=マイヤー推定量」の記事については、「カプラン=マイヤー推定量」の概要を参照ください。
- プラグインアプローチのページへのリンク