確率的な問題におけるベルマン方程式とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > 確率的な問題におけるベルマン方程式の意味・解説 

確率的な問題におけるベルマン方程式

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/03 14:35 UTC 版)

ベルマン方程式」の記事における「確率的な問題におけるベルマン方程式」の解説

マルコフ過程」も参照 決定論的な条件では、上述最適制御問題を解くために動的計画法以外の手法用いることが出来る。ある種問題に対しては、この手法は便利であるが、確率過程のもつ性質注意する必要がある経済学における具体的な例題として、時刻 0 {\displaystyle 0} において初期富(初期資産a 0 {\displaystyle a_{0}} を持ち、無限の寿命を持つ消費者考える。彼は、瞬間的効用関数 u ( c ) {\displaystyle u(c)} を持つとする。ただし、 c {\displaystyle c} は消費額を表し次の時刻における割引率を 0 < β < 1 {\displaystyle 0<\beta <1} とする。時刻 t {\displaystyle t} において消費されなかった富は、金利 r {\displaystyle r} と共に次の時刻繰り越される。すると消費者効用最大化問題は、消費計画 { c t } {\displaystyle \{c_{t}\}} を次式によって決定する問題となる。 maxt = 0 ∞ β t u ( c t ) {\displaystyle \max \sum _{t=0}^{\infty }\beta ^{t}u(c_{t})} ただし次の条件のもとで: a t + 1 = ( 1 + r ) ( a t − c t ) , c t ≥ 0 , {\displaystyle a_{t+1}=(1+r)(a_{t}-c_{t}),\;c_{t}\geq 0,} および lim t → ∞ a t ≥ 0. {\displaystyle \lim _{t\rightarrow \infty }a_{t}\geq 0.} 最初条件は、問題設定記述され資本の蓄積示し二つ目条件消費者人生の終わり置いて負債先送りできないという横断条件英語版)を示す。 ベルマン方程式は次式となる。 V ( a ) = max 0 ≤ c ≤ a { u ( c ) + β V ( ( 1 + r ) ( a − c ) ) } , {\displaystyle V(a)=\max _{0\leq c\leq a}\{u(c)+\beta V((1+r)(a-c))\},} この代わりに、同じ問題例えハミルトン方程式で扱う事もできる。 今、金利時間とともに変化するとすれば消費者確率的最適化問題直面する金利 r {\displaystyle r} がマルコフ過程従い、その推移確率測度を Q ( r , d μ r ) {\displaystyle Q(r,d\mu _{r})} 、ただし、 d μ r {\displaystyle d\mu _{r}} を現在の金利が r {\displaystyle r} の時に次の時刻金利変動決定する確率測度であるとしよう。このモデルでは、現在の金利示され直後に、消費者決定下すものとする。 この場合単純な消費系列 { c t } {\displaystyle \{c_{t}\}} を選ぶ代わりに消費者は彼/彼女の全人生にわたる効用期待値最大となるように { c t } {\displaystyle \{c_{t}\}} を各時点でのあり得る利率 { r t } {\displaystyle \{r_{t}\}} に応じて選ばなくてはならないmax E ( ∑ t = 0 ∞ β t u ( c t ) ) . {\displaystyle \max \mathbb {E} {\bigg (}\sum _{t=0}^{\infty }\beta ^{t}u(c_{t}){\bigg )}.} 期待値 E {\displaystyle \mathbb {E} } は、金利 r {\displaystyle r} の系列に関して Q {\displaystyle Q} で与えられる確率測度に関して計算される。 r {\displaystyle r} はマルコフ過程なので、問題動的計画法によって劇的に単純化される。ベルマン方程式は単に以下の形となる。 V ( a , r ) = max 0 ≤ c ≤ a { u ( c ) + β ∫ V ( ( 1 + r ) ( a − c ) , r ′ ) Q ( r , d μ r ) } . {\displaystyle V(a,r)=\max _{0\leq c\leq a}\{u(c)+\beta \int V((1+r)(a-c),r')Q(r,d\mu _{r})\}.} ある一般的な仮定のもとで、結果として得られる最適な方策関数 g ( a , r ) {\displaystyle g(a,r)} は可測となる。 マルコフ的なショック伴い主体事後選択を行うような一般的な確率的時系列最適化問題に対しては、ベルマン方程式は非常に良く似た形をとる。 V ( x , z ) = max c ∈ Γ ( x , z ) F ( x , c , z ) + β ∫ V ( T ( x , c ) , z ′ ) d μ z ( z ′ ) . {\displaystyle V(x,z)=\max _{c\in \Gamma (x,z)}F(x,c,z)+\beta \int V(T(x,c),z')d\mu _{z}(z').}

※この「確率的な問題におけるベルマン方程式」の解説は、「ベルマン方程式」の解説の一部です。
「確率的な問題におけるベルマン方程式」を含む「ベルマン方程式」の記事については、「ベルマン方程式」の概要を参照ください。

ウィキペディア小見出し辞書の「確率的な問題におけるベルマン方程式」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「確率的な問題におけるベルマン方程式」の関連用語

確率的な問題におけるベルマン方程式のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



確率的な問題におけるベルマン方程式のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaのベルマン方程式 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS