AlphaGo
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/01/18 07:21 UTC 版)
アルゴリズム
AlphaGo Master までは、ディープニューラルネットワークを用いて実装された「value network」と「policy network」によって動くモンテカルロ木探索を用いていた[2]。しかし、AlphaGo Zero では、ニューラルネットワークは一つに統合された。
AlphaGoは当初、棋譜に記録された熟練した棋士の手と合致するよう試みることによって、人間のプレーヤーを模倣するように訓練された。ある程度の能力に達すると、強化学習を用いて自分自身と多数の対戦を行ってさらに訓練された[2]。しかし、AlphaGo Zero では、ルール以外の知識は全く与えずに強化学習をして、40日という短時間で AlphaGo Master に100戦して89勝するまでになった。
ハードウェア
配置 | スレッド検索数 | CPU数 | GPU数 | イロレーティング |
---|---|---|---|---|
単独 | 40 | 48 | 1 | 2,151 |
単独 | 40 | 48 | 2 | 2,738 |
単独 | 40 | 48 | 4 | 2,850 |
単独 | 40 | 48 | 8 | 2,890 |
分散処理 | 12 | 428 | 64 | 2,937 |
分散処理 | 24 | 764 | 112 | 3,079 |
分散処理 | 40 | 1,202 | 176 | 3,140 |
分散処理 | 64 | 1,920 | 280 | 3,168 |
Google Cloud Platformのコンピュータ資源(CPU1202個、GPU176基)を使って学習させている。また、TensorFlowに対応したディープラーニング専用プロセッサ「Tensor Processing Unit (TPU)」をも使用している。
戦績
- vs樊麾 5勝0敗(非公開対局)
日付 | 結果 | 先番 | 相手 |
---|---|---|---|
2016.3.9 | 中押し勝ち | 李世乭 | |
2016.3.10 | 中押し勝ち | △ | |
2016.3.12 | 中押し勝ち | ||
2016.3.13 | 中押し負け | △ | |
2016.3.15 | 中押し勝ち | ||
2017.5.23 | 一目半勝ち | 柯潔 | |
2017.5.25 | 中押し勝ち | △ | |
2017.5.27 | 中押し勝ち | △ |
※AlphaGoから見た結果
- ^ 布留川英一 2019, p. 19.
- ^ a b c d e “Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning”. Google Research Blog (2016年1月27日). 2016年1月29日閲覧。
- ^ a b c “Google achieves AI 'breakthrough' by beating Go champion”. BBC News (2016年1月27日). 2016年1月29日閲覧。
- ^ “囲碁AIに「名誉九段」授与=韓国棋院=”. 朝鮮日報 (2016年3月15日). 2016年3月15日閲覧。
- ^ “中国围棋协会授予AlphaGo职业九段 并颁发证书” (Chinese) (2017年5月27日). 2017年5月29日閲覧。
- ^ “世界トップ棋士を制したGoogleの囲碁AI「AlphaGo」、引退へ” (2017年5月29日). 2017年5月29日閲覧。
- ^ “After Win in China, AlphaGo’s Designers Explore New AI” (2017年5月27日). 2017年6月2日閲覧。
- ^ “[Breaking AlphaGo victorious once again”]. THE KOREATIMES. (2016年3月10日) 2016年3月11日閲覧。
- ^ Number of legal Go positions
- ^ Silver, David; Huang, Aja; Maddison, Chris; Guez, Arthur; Sifre, Laurent; van den Driessche, George; Schrittwieser, \tJulian; Antonoglou, Ioannis et al. (2016-01-28). “Mastering the game of Go with deep neural networks and tree search”. Nature .
- ^ Wedd, Nick. “Human-Computer Go Challenges”. computer-go.info. 2011年10月28日閲覧。
- ^ 日本棋院が協力する電聖戦では4子から3子のハンディキャップを付けていた
- ^ “Computer scores big win against humans in ancient game of Go”. CNN (2016年1月28日). 2016年1月28日閲覧。
- ^ Johnson, George (1997-07-29), “To Test a Powerful Computer, Play an Ancient Game”, The New York Times 2008年6月16日閲覧。
- ^ “Google AlphaGo AI clean sweeps European Go champion”. ZDNet (2016年1月28日). 2016年1月28日閲覧。
- ^ 「アルファ碁ゼロ」が登場、完全な教師なし学習で世界最強に
- ^ 世界最強の碁プログラム・AlphaGoの新バージョン「AlphaGo Zero」はもう自力で強くなれるレベルに到達
- ^ 「AlphaGo Zero」──ビッグデータ不要のAI棋士が自己対局のみで世界最強に
- ^ グーグルの最新AI「AlphaZero」は、3つのゲームで人間を超えた──その実力と「次のステップ」
- ^ “Google achieves AI 'breakthrough' by beating Go champion - BBC News” (2016年1月27日). 2016年1月28日閲覧。
- ^ a b c Elizabeth Gibney (27 January 2016), “Go players react to computer defeat”, Nature, doi:10.1038/nature.2016.19255
- ^ “AlphaGo defeats Lee Sedol in first game of historic man vs machine match”. Go Game Guru (2016年3月9日). 2016年3月9日閲覧。
- ^ “Zen computer Go program beats Takemiya Masaki with just 4 stones!”. Go Game Guru. 2016年1月28日閲覧。
- ^ “「アマ六段の力。天才かも」囲碁棋士、コンピューターに敗れる 初の公式戦”. MSN Sankei News. 2013年3月27日閲覧。
- ^ Dana Mackenzie (9 March 2016). “Update: Why this week’s man-versus-machine Go match doesn't matter (and what does)”. Science. doi:10.1126/science.aaf4152 .
- ^ Ben Kloester (2016年3月4日). “Can AlphaGo defeat Lee Sedol?”. Go Game Guru. 2016年3月10日閲覧。
- ^ “AlphaGo Korean Press Briefing” (2016年1月28日). 2016年3月10日閲覧。
- ^ “Mastering the game of Go with deep neural networks and tree search”. Nature (2016年1月28日). 2016年1月28日閲覧。
- ^ a b “アルファ碁、最終局も制す 最強・李九段に4勝1敗”. 朝日新聞. (2016年3月15日) 2016年3月15日閲覧。
- ^ https://twitter.com/demishassabis/status/816660463282954240
- ^ “「AlphaGoは李世ドルに勝っても、僕には勝てない」 世界最強の囲碁棋士(18歳)がコメント”. ねとらぼ. ITmedia (2016年3月9日). 2017年5月16日閲覧。
- ^ “World's Go Player Ratings” (2016年3月). 2017年5月16日閲覧。
- ^ “揭秘谷歌围棋战大赢家:柯洁微博粉丝翻20倍”. 新浪科技 (2016年3月10日). 2017年5月16日閲覧。
- ^ “人机终极对决或年内举行柯洁将战AlphaGo”. 新浪網 (2016年6月8日). 2017年5月16日閲覧。
- ^ a b “囲碁の神秘を求めて ーー Future of Go Summit 開催”. Google (2017年4月10日). 2017年5月23日閲覧。
- ^ “米アルファ碁「世界最強」降す 柯九段「強くなった」”. 毎日新聞 (2017年5月24日). 2017年5月24日閲覧。
- ^ “米グーグルのAI、世界最強の中国囲碁棋士に第1局で勝利”. ロイター (2017年5月24日). 2017年5月24日閲覧。
- ^ “囲碁AIが世界最強棋士に連勝 開発会社CEOは柯九段の健闘たたえる”. 産経ニュース (2017年5月26日). 2017年5月26日閲覧。
- ^ “トップ棋士5人でも敗北 アルファ碁実力示す、中国”. 産経ニュース (2017年5月26日). 2017年5月26日閲覧。
- ^ “「AlphaGoは楽しい」対局中のプロ棋士5人の笑顔が物語るもの:現地レポート”. WIRED (2017年5月27日). 2017年5月27日閲覧。
- ^ “「AlphaGo」という“神”の引退と、人類最強の19歳が見せた涙の意味:現地レポート”. WIRED (2017年5月28日). 2017年5月29日閲覧。
- ^ “AIアルファ碁3連勝「人間との対局は終える」”. 読売新聞 (2017年5月26日). 2017年5月27日閲覧。
- ^ “「アルファ碁」足掛かりに中国再参入を目指すグーグル”. WSJ. 2017年5月29日閲覧。
- ^ “Google deploys AI for Go tournament in China charm offensive AlphaGo”. Financial Times. 2017年5月27日閲覧。
- ^ “Chinese Go master Ke Jie loses to Google's AlphaGo in first of three-game match - People's Daily Online”. 人民網. 2017年5月27日閲覧。
- ^ “中国、アルファ碁との対局中継取り消し グーグルとの確執関係か”. 産経ニュース (2017年5月24日). 2017年5月23日閲覧。
- ^ “Google’s AlphaGo Defeats Chinese Go Master in Win for A.I.”. ニューヨーク・タイムズ (2017年5月24日). 2017年5月23日閲覧。
- ^ “グーグル、中国にAI研究センターを開設--「この種の研究施設はアジア初」”. CNET (2017年12月14日). 2017年12月15日閲覧。
- ^ “Google launching artificial intelligence research center in China”. 新浪 (2017年12月13日). 2017年12月15日閲覧。
- ^ 「AlphaGo Zero」──ビッグデータ不要のAI棋士が自己対局のみで世界最強に
- ^ 棋譜学ばず「独学3日」、最強の囲碁AI誕生
- ^ 自己対局で成長する囲碁AI「AlphaGo Zero」が登場--実力すでに世界最強
- ^ https://wired.jp/2017/12/08/deepmind-alphazero/
- ^ 「囲碁AI新時代」p. 38 マイナビ出版, 王銘琬著
- ^ Silver, D. et al. Mastering the Game of Go with Deep Neural Networks and Tree Search. Nature. 2016. 529(7587), p.484-489.
- ^ Connor, Steve (2016年1月27日). “A computer has beaten a professional at the world's most complex board game” (英語). 'The Independent'. 2016年1月28日閲覧。
- ^ “Google's AI beats human champion at Go”. CBC News (2016年1月27日). 2016年1月28日閲覧。
- ^ Müller, Martin. Computer Go, Artificial Intelligence 134 (2002): p150
- ^ チョン・ヒョンソク (2017年3月12日). “原因は「アルファ碁」!?韓国で囲碁人気失速”. 朝鮮日報. 2017年3月12日時点のオリジナルよりアーカイブ。2017年3月14日閲覧。
- ^ “コンピュータはより人間らしくなった!?「天頂の囲碁」ソフト開発者インタビュー”. ニュースウォーカー (2016年7月14日). 2017年4月23日閲覧。
- ^ 探索範囲の膨大さと局面評価の難しさにより、人間に勝つにはあと10年かかるといわれていた。
- AlphaGoのページへのリンク