非決定プランニングでのヒューリスティック関数とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > ウィキペディア小見出し辞書 > 非決定プランニングでのヒューリスティック関数の意味・解説 

非決定プランニングでのヒューリスティック関数

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/01/16 01:19 UTC 版)

自動計画」の記事における「非決定プランニングでのヒューリスティック関数」の解説

決定的プランニング問題への強力なヒューリスティクス関数として、決定化(Determination)がある。これは、現在ノードからゴールまでのコスト下界を、問題決定的であると仮定して解くことにより得る手法である。この手法は驚くほどシンプルであるが、国際コンペティション IPC 2004 確率的プランニング部門優勝しその後活発に研究された。決定化にも複数種類有り、「成功」と「失敗と言ったように片方がもう一方dominateする場合には「成功」だけを採択して決定化する手法や、すべての決定的実行結果別のノードとして扱うことによる決定化、あるいは(確率的プランニング最適性求められない場合)もっとも確からしい結果のみを用い決定化などが存在する近年ポリシー実数値関数としてニューラルネットワークにより近似し、これを強化学習によって訓練する手法活発に研究されている。これらの手法によって得られポリシー関数・Q関数は、プランニングにおけるヒューリスティック関数を同様、実行時探索誘導する役目持っている。しかし、これらの学習され関数プランニングにおけるヒューリスティック関数には大きな違いがある。 学習され関数特定の問題ドメイン特化した関数である。例えば、特定のゲームのために訓練されポリシー関数は、別のゲームにおいては使うことが出来ないメタ強化学習仮定するとしても、あくまでも訓練ゲーム似たドメインにおいて内挿を行うことが暗黙前提となっている。 プランニングにおけるヒューリスティック関数訓練を必要としない新たに与えられ問題を、問題を解く時間の中で分析し自動探索誘導を行う。言い換えれば初め見た問題観察しその場学習を行うと言うこともできる。 プランニングにおけるヒューリスティック関数問題の解コスト下界関数である。有限時間学習停止されポリシー関数そのような性質はない。これは、時間無限にとった極限正しポリシー関数収束することとは別の性質である。

※この「非決定プランニングでのヒューリスティック関数」の解説は、「自動計画」の解説の一部です。
「非決定プランニングでのヒューリスティック関数」を含む「自動計画」の記事については、「自動計画」の概要を参照ください。

ウィキペディア小見出し辞書の「非決定プランニングでのヒューリスティック関数」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「非決定プランニングでのヒューリスティック関数」の関連用語

1
14% |||||

非決定プランニングでのヒューリスティック関数のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



非決定プランニングでのヒューリスティック関数のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの自動計画 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2024 GRAS Group, Inc.RSS