一般政策 (逐次決定過程における)
【英】:general policy
有限 段逐次決定過程において, 過去の状態の履歴に依存して定まる政策. すなわち, 時刻
での決定を, 状態空間
からなる
個の直積
から決定空間
への関数
で定めるとき, これらの決定関数の列
を一般政策という. 非加法型最適化問題では一般政策クラスで最適化が行われ, 不変埋没原理によって, このクラスの最適政策が得られる.
動的・確率・多目的計画: | マックスマックス定理 マルコフ両決定過程 マルコフ政策 一般政策 三面鏡理論 不変埋没原理 両帰式 |
一般政策と同じ種類の言葉
- 一般政策のページへのリンク