制約付きマルコフ決定過程
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/05/05 04:50 UTC 版)
「マルコフ決定過程」の記事における「制約付きマルコフ決定過程」の解説
制約付きマルコフ決定過程 (Constrained Markov Decision Process; CMDP) はマルコフ決定過程の拡張である。MDP と CMDP には3つの基本的な違いがある: ある行動をほかのものの代わりに適用した後で(複数の)コストが発生する CMDP は線形計画法のみで解くことが出来る(動的計画法を用いることはできない) 終端時刻における政策が初期状態に依存する CMDP の応用例は数多く存在し、最近ではロボット工学におけるモーションプランニングに用いられている。
※この「制約付きマルコフ決定過程」の解説は、「マルコフ決定過程」の解説の一部です。
「制約付きマルコフ決定過程」を含む「マルコフ決定過程」の記事については、「マルコフ決定過程」の概要を参照ください。
- 制約付きマルコフ決定過程のページへのリンク