partially observable Markov decision processとは？わかりやすく解説

部分観測マルコフ決定過程(ぶぶんかんそくマルコフけっていかてい、英: partially observable Markov decision process; POMDP)はマルコフ決定過程 (MDP) の一般化であり、状態を直接観測できないような意思決定過程におけるモデル化の枠組みを与える。

POMDP は実世界におけるあらゆる逐次的な意思決定過程をモデル化するのに十分であり、ロボットのナビゲーションや機械整備 (machine maintenance)、および不確実な状況下でのプランニングなどに応用されている。 POMDP はオペレーションズリサーチを起源とし、のちに人工知能や自動計画のコミュニティに引き継がれた。

定義

「マルコフ決定過程#定義」も参照

POMDP は、マルコフ決定過程に観測を表現するための要素を追加することで定義される^[1]。まず、マルコフ決定過程は次に挙げる 4 つの要素の組 $({\mathcal {S}},{\mathcal {A}},T,R)$ カテゴリ

この項目は、コンピュータに関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています（PJ:コンピュータ/P:コンピュータ）。

[1]

partially observable Markov decision processとは？ わかりやすく解説

部分観測マルコフ決定過程

定義

急上昇のことば

「partially observable Markov decision process」の関連用語

partially observable Markov decision processとは？わかりやすく解説