Q学習とは? わかりやすく解説

Weblio 辞書 > 同じ種類の言葉 > 学問 > 教育 > 学習 > Q学習の意味・解説 

Q学習

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/06/04 03:44 UTC 版)

Category:機械学習


  1. ^ Christopher J. C. H. Watkins. “PhD Thesis: Learning from Delayed Rewards”. cs.rhul.ac.uk. 2023年11月30日閲覧。
  2. ^ Richard S. Sutton; Andrew G. Barto (2018). Reinforcement Learning, second edition: An Introduction. Bradford Books. ISBN 978-0262039246. http://incompleteideas.net/book/the-book-2nd.html 
  3. ^ Watkins, Christopher J. C. H.; Dayan, Peter (1992-05-01). “Q-learning”. Machine Learning 8 (3): 279–292. doi:10.1007/BF00992698. 


「Q学習」の続きの解説一覧

Q学習

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/10/23 16:27 UTC 版)

強化学習」の記事における「Q学習」の解説

詳細は「Q学習」を参照 Q学習(Q-learning)は方策オフ型のTD学習。 Q ( s t , a t ) ← Q ( s t , a t ) + α [ r t + 1 + γ max p Q ( s t + 1 , p ) − Q ( s t , a t ) ] {\displaystyle Q(s_{t},a_{t})\leftarrow Q(s_{t},a_{t})+\alpha \left[r_{t+1}+\gamma \max _{p}Q(s_{t+1},p)-Q(s_{t},a_{t})\right]}

※この「Q学習」の解説は、「強化学習」の解説の一部です。
「Q学習」を含む「強化学習」の記事については、「強化学習」の概要を参照ください。

ウィキペディア小見出し辞書の「Q学習」の項目はプログラムで機械的に意味や本文を生成しているため、不適切な項目が含まれていることもあります。ご了承くださいませ。 お問い合わせ



Q学習と同じ種類の言葉


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「Q学習」の関連用語

Q学習のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



Q学習のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアのQ学習 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。
ウィキペディアウィキペディア
Text is available under GNU Free Documentation License (GFDL).
Weblio辞書に掲載されている「ウィキペディア小見出し辞書」の記事は、Wikipediaの強化学習 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。

©2024 GRAS Group, Inc.RSS