推論量
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/10/14 10:06 UTC 版)
「変分オートエンコーダー」の記事における「推論量」の解説
簡単な計算により変分下界は L ( θ , ϕ , x ) = E q ϕ ( z | x ) [ log p θ ( x | z ) ) ] − K L ( q ϕ ( z | x ) ‖ p ( z ) ) {\displaystyle {\mathcal {L}}(\theta ,\phi ,\mathbf {x} )=\mathbb {E} _{q_{\phi }(\mathbf {z} |\mathbf {x} )}[\log p_{\theta }(\mathbf {x} |\mathbf {z} ))]-\mathrm {KL} (q_{\phi }(\mathbf {z} |\mathbf {x} )\|p(\mathbf {z} ))} と書き換えられる事が示せる(ここで E [ ⋅ ] {\displaystyle \mathbb {E} [\cdot ]} は期待値である)ので、仮定(P1)を用いる事で L ( θ , ϕ , x ) {\displaystyle {\mathcal {L}}(\theta ,\phi ,\mathbf {x} )} の値を推定するSGVB推定量を L ~ ( θ , ϕ , x , ( ε ( ℓ ) ) ℓ = 1 , … , L ) ) := 1 L ∑ ℓ = 1 L log p θ ( x | g ϕ ( x , ε ( ℓ ) ) ) − K L ( q ϕ ( z | x ) ‖ p ( z ) ) {\displaystyle {\tilde {\mathcal {L}}}(\theta ,\phi ,\mathbf {x} ,({\boldsymbol {\varepsilon }}^{(\ell )})_{\ell =1,\ldots ,L})):={1 \over L}\sum _{\ell =1}^{L}\log p_{\theta }(\mathbf {x} |g_{\phi }(\mathbf {x} ,{\boldsymbol {\varepsilon }}^{(\ell )}))-\mathrm {KL} (q_{\phi }(\mathbf {z} |\mathbf {x} )\|p(\mathbf {z} ))} ...(L1) により定義する#原論文:2.3節。ここで ε ( ℓ ) {\displaystyle {\boldsymbol {\varepsilon }}^{(\ell )}} ( ℓ = 1 , … , L {\displaystyle \ell =1,\ldots ,L} )は E {\displaystyle {\mathcal {E}}} から独立に抽出した乱数であり、Lはハイパーパラメーターである。 SGVB推定量を計算するにはカルバック・ライブラー情報量 K L ( q ϕ ( z | x ) ‖ p ( z ) ) {\displaystyle \mathrm {KL} (q_{\phi }(\mathbf {z} |\mathbf {x} )\|p(\mathbf {z} ))} を計算できる必要がある。原論文ではこの値が計算できないときの為の推定量も提案しているが#原論文:2.3節、本項では割愛する。
※この「推論量」の解説は、「変分オートエンコーダー」の解説の一部です。
「推論量」を含む「変分オートエンコーダー」の記事については、「変分オートエンコーダー」の概要を参照ください。
- 推論量のページへのリンク