動的計画法の考え方とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > 動的計画法の考え方の意味・解説 

動的計画法の考え方

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/03/03 14:35 UTC 版)

ベルマン方程式」の記事における「動的計画法の考え方」の解説

ベルマン方程式理解するには、いくつかの背景となる概念理解しなくてはならない第一に最適化問題何らかの目標を持つ。具体例挙げれば移動時間最短にする、コスト最小抑える利益最大化する、効用最大化する、などである。これらの目標数学関数表現したものを 目的関数 (objective function) と呼ぶ。 動的計画法複数段階にわたる計画問題を、各時点簡単な手順へと分解する。そのため、ある時点なされた決定それ以降どのように影響を及ぼす正しく記述しなくてはならない正しい判断下すために必要な現在の状況を示す情報を 状態 (state) と呼ぶ。例えば、人がある時点何をどれだけ消費する決めるには、(何よりもまず)現在の富(資産額)を知らなてはならない。 そのゆえ、富は、経済活動を行う人が持つ状態変数英語版)の一つ考えられる言うまでもなくこのような状態変数は他にも存在する任意の時点で選ぶことのできる変数通常 制御変数英語版) (control variables) と呼ぶ。 例えば、人々与えられた富のもとで、どれだけ消費すべきか判断する制御変数を選ぶことは、次の状態を選択することでもある。ただし、一般に次の状態は制御変数だけではなく他の要因によっても影響を受ける。具体例示そう。最も単純には、今日の富(状態)と消費制御変数)によって明日の富(次の状態)が決まる。だが、多く場合明日の富には別の要因(例:予期せぬボーナス天災など)も影響するであろう動的計画法は、与えられたどんな状態に対しても、適切な制御指針与えるような最適な計画記述する一例として、消費 c {\displaystyle c} が富 W {\displaystyle W} だけに依存する場合には、我々は、財産関数として消費決定するような制御則 c ( W ) {\displaystyle c(W)} を探索することになる。 状態に基づいて制御変数決定するこのような関数を、方策関数 (policy function)(Bellman、1957、Ch. III.2を参照)と呼ぶ。 最後に最適な決定ルール制御則)はその定義から、実現可能な最良目的関数の値をもたらすのである例えば、ある人が与えられた富のもと、満足度最大化するための消費活動を選ぶとしよう。ただし、満足度 H {\displaystyle H} は効用関数(utility function)のような目的関数表現できるとする。この時、各時刻財産はそれで実現可能な満足度最大値 H ( W ) {\displaystyle H(W)} と関係付けることができる。ある状態で実現しうる最良目的関数の値を示す関数価値関数 (value function) と呼ぶ。 リチャード・ベルマンは、離散時間形式動的最適化問題が、ある時刻価値関数とその次の時刻価値関数の間の関係式書き下すことによって、再帰的な、後ろ向き帰納法英語版)(backward induction)と呼ばれる逐次的形式表現できることを示した上述時間的に隣接する二つ価値関数関係式ベルマン方程式である。このアプローチでは、終端時刻における最適な方策は、その時刻の状態変数関数としてすでに決まっており、結果として得られる目的関数最適値は状態変数与えられる次に最後から一つ前時刻最適化考えると、決定に際して、その状態変数付随する最適な方策のもとで、その時刻の目的関数未来目的関数の和を最大化する。このアルゴリズムは、再帰的時間遡る形で進み初期時刻において、初期状態関数としての決定ルール初期時刻固有の目的関数2番目のステップ価値関数第2ステップ以降すべての未来価値)の和の最適化計算によって得られるまで繰り返される。ゆえに、各ステップにおける決定は、それ以降未来すべての判断最適である事を前提として行われるのである

※この「動的計画法の考え方」の解説は、「ベルマン方程式」の解説の一部です。
「動的計画法の考え方」を含む「ベルマン方程式」の記事については、「ベルマン方程式」の概要を参照ください。

ウィキペディア小見出し辞書の「動的計画法の考え方」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「動的計画法の考え方」の関連用語

動的計画法の考え方のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



動的計画法の考え方のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaのベルマン方程式 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2025 GRAS Group, Inc.RSS