強化学習とは?

Weblio 辞書 > 同じ種類の言葉 > 学問 > 教育 > 学習 > 強化学習の意味・解説 

きょうか‐がくしゅう〔キヤウクワガクシフ〕【強化学習】

人工知能における、コンピューターによる機械学習一種解決すべき課題に対し、より正し結果を得るため、試行錯誤通じて自ら得られる報酬最大化するよう学習を進める。報酬は、確率的にある程度遅れてもたらされる学習速度遅く適切なアルゴリズム設計難しいが、現実世界に近い不確実性のある環境条件の下で、最適方策を自ら獲得する特長をもつ。→教師あり学習


強化学習

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/10/23 16:27 UTC 版)

強化学習(きょうかがくしゅう、: reinforcement learning)とは、ある環境内におけるエージェントが、現在の状態を観測し、取るべき行動を決定する問題を扱う機械学習の一種。エージェントは行動を選択することで環境から報酬を得る。強化学習は一連の行動を通じて報酬が最も多く得られるような方策(policy)を学習する。環境はマルコフ決定過程として定式化される。代表的な手法としてTD学習Q学習が知られている。




「強化学習」の続きの解説一覧



強化学習と同じ種類の言葉


英和和英テキスト翻訳>> Weblio翻訳
英語⇒日本語日本語⇒英語
  

辞書ショートカット

すべての辞書の索引

「強化学習」の関連用語

強化学習のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



強化学習のページの著作権
Weblio 辞書情報提供元は参加元一覧にて確認できます。

  
デジタル大辞泉デジタル大辞泉
(C)Shogakukan Inc.
株式会社 小学館
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの強化学習 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2020 Weblio RSS