確率システムへの拡張とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > 確率システムへの拡張の意味・解説 

確率システムへの拡張

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/04/19 10:25 UTC 版)

ハミルトン-ヤコビ-ベルマン方程式」の記事における「確率システムへの拡張」の解説

システム制御問題ベルマン最適性原理適用し最適制御戦略時間遡る形で解く手法は、確率微分方程式表現されるシステム制御問題拡張することができる。上述問題良く似た次の問題考えようmin E ⁡ { ∫ 0 T C ( t , X t , u t ) d t + D ( X T ) } {\displaystyle \min \operatorname {E} \left\{\int _{0}^{T}C(t,X_{t},u_{t})\,dt+D(X_{T})\right\}} ここでは、最適化したい(1次元確率過程 ( X t ) t ∈ [ 0 , T ] {\displaystyle (X_{t})_{t\in [0,T]}\,\!} とその入力 ( u t ) t ∈ [ 0 , T ] {\displaystyle (u_{t})_{t\in [0,T]}\,\!} を考える。確率過程 ( X t ) t ∈ [ 0 , T ] {\displaystyle (X_{t})_{t\in [0,T]}\,\!} は次の確率微分方程式に従う拡散過程英語版)であるとする。 d X t = μ ( t , X t , u t ) d t + σ ( t , X t , u t ) d w t , {\displaystyle dX_{t}=\mu (t,X_{t},u_{t})dt+\sigma (t,X_{t},u_{t})dw_{t},} ただし、 ( w t ) t ∈ [ 0 , T ] {\displaystyle (w_{t})_{t\in [0,T]}\,\!} は標準ブラウン運動ウィーナー過程)であり、 μ , σ {\displaystyle \mu ,\;\sigma } は標準的な仮定満たす可測関数であるとする。直観的に解釈すれば状態変数 X {\displaystyle X} は瞬間的に μ d t {\displaystyle \mu dt} だけ増減するが、同時に正規ノイズ σ d w t {\displaystyle \sigma dw_{t}} の影響受けている。この時、ベルマン最適性原理用い次に価値関数 V ( X t , t ) {\displaystyle V(X_{t},t)} を伊藤ルール使って展開することにより、価値関数についてのHJB方程式得られる。 − ∂ V ( x , t ) ∂ t − min u { A u V ( x , t ) + C ( t , x , u ) } = 0 , {\displaystyle -{\frac {\partial V(x,t)}{\partial t}}-\min _{u}\left\{{\mathcal {A}}^{u}V(x,t)+C(t,x,u)\right\}=0,} ここで、 A u {\displaystyle {\mathcal {A}}^{u}} は無限小生成作用素英語版)と呼ばれる関数作用素で以下のように表されるA u V ( x , t ) := μ ( t , x , u ) ∂ V ( x , t ) ∂ x + 1 2 ( σ ( t , x , u ) ) 2 ∂ 2 V ( x , t ) ∂ x 2 {\displaystyle {\mathcal {A}}^{u}V(x,t):=\mu (t,x,u){\frac {\partial V(x,t)}{\partial x}}+{\frac {1}{2}}{\Big (}\sigma (t,x,u){\Big )}^{2}{\frac {\partial ^{2}V(x,t)}{\partial x^{2}}}} 非確率的な設定の下では存在しなかった σ 2 / 2 {\displaystyle \sigma ^{2}/2} に価値関数 V ( x , t ) {\displaystyle V(x,t)} の x {\displaystyle x} についての2回微分掛けた項が足されているが、この項は伊藤の公式により生じている。終端条件は次式である。 V ( x , T ) = D ( x ) . {\displaystyle V(x,T)=D(x)\,\!.} ランダム性消えたことに注意しよう。 この場合、 V {\displaystyle V\,\!} の解は元の問題最適解候補であるにすぎず、さらなる検証が必要である。 この技術金融工学において、市場における最適投資戦略定めるため広く用いられている (例: マートンのポートフォリオ問題)。

※この「確率システムへの拡張」の解説は、「ハミルトン-ヤコビ-ベルマン方程式」の解説の一部です。
「確率システムへの拡張」を含む「ハミルトン-ヤコビ-ベルマン方程式」の記事については、「ハミルトン-ヤコビ-ベルマン方程式」の概要を参照ください。

ウィキペディア小見出し辞書の「確率システムへの拡張」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「確率システムへの拡張」の関連用語

確率システムへの拡張のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



確率システムへの拡張のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaのハミルトン-ヤコビ-ベルマン方程式 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS