不確実性のある環境でのプランニング
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/01/16 01:19 UTC 版)
「自動計画」の記事における「不確実性のある環境でのプランニング」の解説
アクションの実行結果に不確実性を取り入れたプランニングは 非決定的プランニング(Nondeterministic Planning) と呼ばれる。非決定的プランニングのもとでは、一つのアクションの結果として複数の実行結果がありえ、どの状態に遷移するかがわからない。古典プランニングの解がアクションの列であるプランを返すのに対し、非決定的プランニングの解はアクションのDAGであるポリシーである。これは、非決定性の影響でアクションの実行結果が枝分かれするからである。非決定的プランニングの探索グラフは、アクションの非決定性を表現できるAND-OR木である。 非決定的プランニングのうち、それぞれの結果について遷移確率があたえられる場合を 確率的プランニング(Probabilistic Planning) と呼ぶ。確率的プランニングはマルコフ決定過程 (MDP) として定式化される。また、不完全情報での確率的プランニングは部分観測マルコフ決定過程 (POMDP) によってモデル化される。 非決定/確率的プランニング問題を表現するモデル言語として、PDDLの拡張言語、Probabilistic PDDL (PPDDL) が2004年に提唱され、コンペティションおよび実応用で用いられている。
※この「不確実性のある環境でのプランニング」の解説は、「自動計画」の解説の一部です。
「不確実性のある環境でのプランニング」を含む「自動計画」の記事については、「自動計画」の概要を参照ください。
- 不確実性のある環境でのプランニングのページへのリンク