AlphaGo Zero
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2024/03/08 14:06 UTC 版)
AlphaGo Zero(アルファ・ゴ・ゼロ)は、DeepMindの囲碁ソフトウェアAlphaGoのバージョンである。AlphaGoのチームは2017年10月19日に学術誌Natureの論文でAlphaGo Zeroを発表した。このバージョンは人間の対局からのデータを使わずに作られており、それ以前の全てのバージョンよりも強い[1]。自分自身との対局を行うことで、AlphaGo Zeroは3日でAlphaGo Leeの強さを超え(100勝0敗)、21日でAlphaGo Masterのレベルに達し、40日で全ての旧バージョンを超えた[2]。
- ^ a b c d e f “Mastering the game of Go without human knowledge”. Nature (2017年10月19日). 2017年10月19日閲覧。
- ^ a b c d e “AlphaGo Zero: Learning from scratch”. DeepMind official website (2017年10月18日). 2017年10月19日閲覧。
- ^ “Google's New AlphaGo Breakthrough Could Take Algorithms Where No Humans Have Gone”. Yahoo! Finance (2017年10月19日). 2017年10月19日閲覧。
- ^ “AlphaGo Zero: Google DeepMind supercomputer learns 3,000 years of human knowledge in 40 days”. Telegraph.co.uk (2017年10月18日). 2017年10月19日閲覧。
- ^ “DeepMind AlphaGo Zero learns on its own without meatbag intervention”. ZDNet (2017年10月19日). 2017年10月20日閲覧。
- ^ “Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm”. 2017年12月23日閲覧。
- ^ “Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours”. 2017年12月23日閲覧。
- ^ a b Greenemeier, Larry. “AI versus AI: Self-Taught AlphaGo Zero Vanquishes Its Predecessor” (英語). Scientific American 2017年10月20日閲覧。
- ^ a b “Computer Learns To Play Go At Superhuman Levels 'Without Human Knowledge'” (英語). NPR. (2017年10月18日) 2017年10月20日閲覧。
- ^ “Google's New AlphaGo Breakthrough Could Take Algorithms Where No Humans Have Gone” (英語). Fortune. (2017年10月19日) 2017年10月20日閲覧。
- ^ “This computer program can beat humans at Go—with no human instruction” (英語). Science | AAAS. (2017年10月18日) 2017年10月20日閲覧。
- ^ “The latest AI can work things out without being taught” (英語). The Economist 2017年10月20日閲覧。
- ^ a b Sample, Ian (2017年10月18日). “'It's able to create knowledge itself': Google unveils AI that learns on its own”. The Guardian 2017年10月20日閲覧。
- ^ “How Google's new AI can teach itself to beat you at the most complex games” (英語). Australian Broadcasting Corporation. (2017年10月19日) 2017年10月20日閲覧。
- ^ “Go Players Excited About ‘More Humanlike’ AlphaGo Zero” (英語). Korea Bizwire. (2017年10月19日) 2017年10月21日閲覧。
- ^ “New version of AlphaGo can master Weiqi without human help” (英語). China News Service. (2017年10月19日) 2017年10月21日閲覧。
- ^ “【柯洁战败解密】AlphaGo Master最新架构和算法,谷歌云与TPU拆解” (Chinese). Sohu (2017年5月24日). 2017年6月1日閲覧。
- ^ David Silver, Thomas Hubert, Julian Schrittwieser, Ioannis Antonoglou, Matthew Lai, Arthur Guez, Marc Lanctot, Laurent Sifre, Dharshan Kumaran, Thore Graepel, Timothy Lillicrap, Karen Simonyan, Demis Hassabis (5 December 2017). "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm". arXiv:1712.01815 [cs.AI]。
- 1 AlphaGo Zeroとは
- 2 AlphaGo Zeroの概要
- 3 以前のバージョンとの比較
AlphaGo Zero
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/10/04 04:32 UTC 版)
「AlphaGo」の記事における「AlphaGo Zero」の解説
詳細は「AlphaGo Zero」を参照 4代目バージョン。TPU4台を使用。 2017年10月に発表された。従来のバージョンとは大きく異なり、棋譜やビッグデータを必要とせず自己対局によって強化される。全くの初心者の状態から3日間の学習でAlphago Leeのレベルに到達し、21日目にAlphago Masterと肩を並べる。40日間の学習後、AlphaGo Leeには100戦全勝、AlphaGo Masterには100戦して89勝11敗と過去のバージョンを圧倒するレベルとなった。
※この「AlphaGo Zero」の解説は、「AlphaGo」の解説の一部です。
「AlphaGo Zero」を含む「AlphaGo」の記事については、「AlphaGo」の概要を参照ください。
AlphaGo Zero
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/10/04 04:32 UTC 版)
「AlphaGo」の記事における「AlphaGo Zero」の解説
AlphaGo Zeroについて書かれた論文「Mastering the game of Go without human knowledge」の著者は以下のメンバーである。AlphaGoと対局したプロ棋士の樊麾も名を連ねている。この論文では、著者のうち冒頭3名の貢献度が等価であると記されている。 デイビッド・シルバー / David Silver ユリアン・シュリットヴィーザー / Julian Schrittwieser カレン・シモニャン / Karen Simonyan イオアニス・アントノグロウ / Ioannis Antonoglou 黄士傑 / Aja Huang アーサー・ゲズ / Arthur Guez トマ・ユベール / Thomas Hubert ルーカス・ベイカー / Lucas Baker マシュー・ライ / Matthew Lai エイドリアン・ボルトン / Adrian Bolton 陳御天 / Yutian Chen ティモシー・リリクラップ / Timothy Lillicrap 樊麾 / Fan Hui ローレン・シフレ / Laurent Sifre ジョージ・ヴァン・デン・ドリエッシェ / George van den Driessche ソーレ・グリーペル / Thore Graepel デミス・ハサビス / Demis Hassabis
※この「AlphaGo Zero」の解説は、「AlphaGo」の解説の一部です。
「AlphaGo Zero」を含む「AlphaGo」の記事については、「AlphaGo」の概要を参照ください。
- AlphaGo Zeroのページへのリンク