マルコフ政策
【英】:Markov policy
有限 段逐次決定過程における一連の決定列を定める関数列を政策という. 現在の時刻
での状態のみに依存する決定は, 状態空間
から決定空間
への関数
で表わされる. 決定関数の列
をマルコフ政策という. 加法型最適化問題ではマルコフ政策クラスで最適化が実現され, 動的計画法の再帰式を解く過程で最適点関数を列挙することによって, 最適政策が得られる.
動的・確率・多目的計画: | ファジィ動的計画 マックスマックス定理 マルコフ両決定過程 マルコフ政策 一般政策 三面鏡理論 不変埋没原理 |
マルコフ政策と同じ種類の言葉
- マルコフ政策のページへのリンク