モンテカルロツリー検索 (MCTS)
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2020/12/10 02:35 UTC 版)
「モンテカルロ木探索」の記事における「モンテカルロツリー検索 (MCTS)」の解説
2006年、これらの研究に触発されて,、レミ・クーロンは、ゲームツリー検索へのモンテカルロ法の適用について説明し、モンテカルロツリー検索という名前を与えた。L・コチシュとCs・セーペスヴァーリはUCT(ツリーに適用される上限信頼限界)アルゴリズムを開発した。とS・ゲーリーらは、彼らのプログラムMoGoにUCTを実装した。2008年に、MoGoは9×9碁で段位のレベルに到達し[18]、Fuegoは9×9碁でアマチュア強豪プレーヤーに勝ち始めた。 2012年1月、Zenは、19×19盤のアマチュア二段のプレーヤーとの番勝負に3対1で勝利した. 。Google Deepmind社はAlphaGoプログラムを開発した。これは、2015年10月に、フルサイズの19x19盤でハンディキャップなしにプロの人間囲碁棋士を倒した最初のコンピュータ碁プログラムとなった。2016年3月、AlphaGoは19×19碁で名誉九段の李世ドルを相手に5番勝負で4勝1敗の成績を挙げた。AlphaGoは、以前の囲碁プログラムを大幅に改善しただけでなく、機械学習は、ポリシー(移動選択)と値に人工ニューラルネットワーク(ディープラーニング手法)を使用したモンテカルロツリー検索を使用したため、以前のプログラムをはるかに上回る効率が得られた。 MCTSアルゴリズムは、他のボードゲーム(例えば、Hex 、Havannah、Amazons、Arimaa)、リアルタイムビデオゲーム(例えばパックマン、Fable Legends)、非決定的ゲーム(SKAT、 ポーカー、マジック・ザ・ギャザリング、カタンの開拓者たち)などに応用された。
※この「モンテカルロツリー検索 (MCTS)」の解説は、「モンテカルロ木探索」の解説の一部です。
「モンテカルロツリー検索 (MCTS)」を含む「モンテカルロ木探索」の記事については、「モンテカルロ木探索」の概要を参照ください。
- モンテカルロツリー検索のページへのリンク