部分観測マルコフ決定過程
(partially observable Markov decision process から転送)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/09/29 11:32 UTC 版)
部分観測マルコフ決定過程(ぶぶんかんそくマルコフけっていかてい、英: partially observable Markov decision process; POMDP)はマルコフ決定過程 (MDP) の一般化であり、状態を直接観測できないような意思決定過程におけるモデル化の枠組みを与える。
POMDP は実世界におけるあらゆる逐次的な意思決定過程をモデル化するのに十分であり、ロボットのナビゲーションや機械整備 (machine maintenance)、および不確実な状況下でのプランニングなどに応用されている。 POMDP はオペレーションズリサーチを起源とし、のちに人工知能や自動計画のコミュニティに引き継がれた。
定義
POMDP は、マルコフ決定過程に観測を表現するための要素を追加することで定義される[1]。
まず、マルコフ決定過程は次に挙げる 4 つの要素の組 カテゴリ
- partially observable Markov decision processのページへのリンク