ハミルトン-ヤコビ-ベルマン方程式
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/02/22 06:21 UTC 版)
ハミルトン-ヤコビ-ベルマン(HJB)方程式(ハミルトン–ヤコビ–ベルマンほうていしき、英: Hamilton–Jacobi–Bellman equation)は、最適制御理論の根幹をなす偏微分方程式である。
その解を「価値関数(value function)」と呼び、対象の動的システムとそれに関するコスト関数(cost function)の最小値を与える。
HJB方程式の局所解は最適性の必要条件を与えるが、全状態空間で解けば必要十分条件を与える。解は開ループ制御則となるが、閉ループ解も導ける。以上の手法は確率システムへも拡張することができるほか、古典的変分問題、例えば最速降下線問題も解くことができる。
HJB方程式は1950年代のリチャード・ベルマンとその共同研究者を先駆とする「動的計画法(Dynamic programming)」理論の成果として得られた[1]。その離散時間形式は通常「ベルマン方程式」と呼称される。
連続時間においては、古典物理学におけるハミルトン-ヤコビ方程式 (ウィリアム・ローワン・ハミルトン (William Rowan Hamilton) および、カール・グスタフ・ヤコブ・ヤコビ (Carl Gustav Jacob Jacobi)による) の拡張形とみなせる。
最適制御問題
時間範囲
- Bellman, R. E. (1954). “Dynamic Programming and a new formalism in the calculus of variations”. Proceedings of the National Academy of Sciences of the United States of America 40 (4): 231-235. PMC 527981. PMID 16589462 .
- Bellman, R. E. (1957). Dynamic Programming. Princeton - 邦訳なし。
- Bellman, R. (1959). “An Application of Dynamic Programming to the Determination of Optimal Satellite Trajectories”. J. Brit.Interplanet. Soc. 17: 78-83.
関連文献
- Dimitri P. Bertsekas (2005). Dynamic programming and optimal control. Athena Scientific
- 川合敏雄「自然法則と最適制御」『日本物理学会誌』第41巻第3号、1986年3月、227-235頁。 - ポントリャーギンの最大原理とハミルトニアンについて平易に解説したエッセイ。
ハミルトン-ヤコビ-ベルマン方程式
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/04/27 01:35 UTC 版)
「リチャード・E・ベルマン」の記事における「ハミルトン-ヤコビ-ベルマン方程式」の解説
ハミルトン-ヤコビ-ベルマン方程式 (HJB) は、最適制御理論の中核をなす偏微分方程式である。HJB方程式の解を「価値関数」と呼び、ある力学系とそのコスト関数を与えられたとき、その最適コストを与える。最速降下問題などの古典的問題もこの手法で解くことができる。 この方程式は動的計画法の理論的研究の成果であり、それはベルマンが同僚と共に1950年代から先駆的に研究していた分野である。これの離散時間版が一般にベルマン方程式と呼ばれている。また、連続時間版は古典物理学の初期の成果を拡張したハミルトン-ヤコビ方程式であり、ウィリアム・ローワン・ハミルトンとカール・グスタフ・ヤコブ・ヤコビが定式化した。
※この「ハミルトン-ヤコビ-ベルマン方程式」の解説は、「リチャード・E・ベルマン」の解説の一部です。
「ハミルトン-ヤコビ-ベルマン方程式」を含む「リチャード・E・ベルマン」の記事については、「リチャード・E・ベルマン」の概要を参照ください。
- ハミルトン-ヤコビ-ベルマン方程式のページへのリンク