HJB方程式の導出とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > HJB方程式の導出の意味・解説 

HJB方程式の導出

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/04/19 10:25 UTC 版)

ハミルトン-ヤコビ-ベルマン方程式」の記事における「HJB方程式の導出」の解説

直感的には、HJB方程式は以下のように導出できる。 V ( x ( t ) , t ) {\displaystyle V(x(t),t)} が上述価値関数(すなわち最小コストであったとすれば、Richard-Bellmanの「最適性の原理」から、 時間 t {\displaystyle t} から t + d t {\displaystyle t+dt} までの変化は次式で表現できる。 V ( x ( t ) , t ) = min u { ∫ t t + d t C ( x ( s ) , u ( s ) ) d s + V ( x ( t + d t ) , t + d t ) } . {\displaystyle V(x(t),t)=\min _{u}\left\{\int _{t}^{t+dt}\!\!\!\!\!\!\!\!C(x(s),u(s))\,ds\;\;+\;\;V(x(t\!+\!dt),t\!+\!dt)\right\}.} 右辺第二項が次のように テイラー展開 できること注目しよう。 V ( x ( t + d t ) , t + d t ) = V ( x ( t ) , t ) + V ˙ ( x ( t ) , t ) d t + ∇ V ( x ( t ) , t ) ⋅ x ˙ ( t ) d t + o ( d t ) , {\displaystyle V(x(t\!+\!dt),t\!+\!dt)\;=\;V(x(t),t)+{\dot {V}}(x(t),t)\,dt+\nabla V(x(t),t)\cdot {\dot {x}}(t)\,dt\;+\;o(dt),} o ( d t ) {\displaystyle o(dt)} はテイラー展開2次上の高次項をランダウ記法表現したものなので無視することにする。価値関数の式にこれを代入した後、 両辺の V ( x ( t ) , t ) {\displaystyle V(x(t),t)} を相殺しd t {\displaystyle dt} で割ってゼロ漸近させれば上述HJB方程式導出できる。

※この「HJB方程式の導出」の解説は、「ハミルトン-ヤコビ-ベルマン方程式」の解説の一部です。
「HJB方程式の導出」を含む「ハミルトン-ヤコビ-ベルマン方程式」の記事については、「ハミルトン-ヤコビ-ベルマン方程式」の概要を参照ください。

ウィキペディア小見出し辞書の「HJB方程式の導出」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「HJB方程式の導出」の関連用語

HJB方程式の導出のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



HJB方程式の導出のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaのハミルトン-ヤコビ-ベルマン方程式 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS