ベルマンの最適性の原理とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > ベルマンの最適性の原理の意味・解説 

ベルマンの最適性の原理

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/03 14:35 UTC 版)

ベルマン方程式」の記事における「ベルマンの最適性の原理」の解説

動的計画法は、この決定問題をより小さな部分問題分割する。リチャード・ベルマンの最適性の原理その方法示している: 最適性の原理Principle of Optimality) : 最適な方策は、初期状態初期決定がどんなものであれ、その結果得られる次の状態に関して以降決定が必ず最適方策になっているという性質をもつ。 (参照Bellman, 1957、Chap. III.3.) コンピュータ・サイエンスでは、このように分割できる問題の事を「部分構造最適性英語版)(optimal substructure)を持つ」と表現する。 この原理は、動的ゲーム理論における部分ゲーム完全均衡subgame perfect equilibrium)と相似概念である。ただし、動的ゲーム理論における最適方策は、相手プレイヤー同様に最適方策選択するという前提に立つ。 最適性の原理から示唆されるように、我々は将来選択時刻1から新しい状態 x 1 {\displaystyle x_{1}} でスタートする)について一旦保留して最初の決定だけを独立検討する将来決定に関する項を大括弧中に集めることにより、先の問題次のように表現されるmax a 0 { F ( x 0 , a 0 ) + β [ max { a t } t = 1 ∞ ∑ t = 1 ∞ β t − 1 F ( x t , a t ) : a t ∈ Γ ( x t ) , x t + 1 = T ( x t , a t ) , ∀ t ≥ 1 ] } {\displaystyle \max _{a_{0}}\left\{F(x_{0},a_{0})+\beta \left[\max _{\left\{a_{t}\right\}_{t=1}^{\infty }}\sum _{t=1}^{\infty }\beta ^{t-1}F(x_{t},a_{t}):a_{t}\in \Gamma (x_{t}),\;x_{t+1}=T(x_{t},a_{t}),\;\forall t\geq 1\right]\right\}} ただし次の条件のもとで: a 0 ∈ Γ ( x 0 ) , x 1 = T ( x 0 , a 0 ) . {\displaystyle a_{0}\in \Gamma (x_{0}),\;x_{1}=T(x_{0},a_{0}).} ここで時刻1での状態が x 1 = T ( x 0 , a 0 ) {\displaystyle x_{1}=T(x_{0},a_{0})} となることを知りつつ、アクション a 0 {\displaystyle a_{0}} を選ぶ。この新しい状態は、時刻1以降すべての決定影響与える。 未来全体決定問題は、右側角括弧中に現れている。

※この「ベルマンの最適性の原理」の解説は、「ベルマン方程式」の解説の一部です。
「ベルマンの最適性の原理」を含む「ベルマン方程式」の記事については、「ベルマン方程式」の概要を参照ください。

ウィキペディア小見出し辞書の「ベルマンの最適性の原理」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「ベルマンの最適性の原理」の関連用語

ベルマンの最適性の原理のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



ベルマンの最適性の原理のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaのベルマン方程式 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS