OR事典 |
政策反復アルゴリズム
読み方:せいさくはんぷくあるごりずむ
【英】:policy iteration algorithm
【英】:policy iteration algorithm
マルコフ決定過程に対する数値解法としてハワードにより提案されたアルゴリズム. 政策評価と政策改良のフェーズを繰り返すことにより, 有限回の反復で最適化を求めることができる. 高速な解法として広く認められており, 収束に要する反復回数は, 経験的に問題の規模にあまり依存しない.
政策反復アルゴリズムと同じ種類の言葉
政策反復アルゴリズムのページへのリンク