深層学習の将棋Aiへの浸透について
- 3. 二人零和有限確定完全情報ゲーム
二人
プレイヤー数
零和(ゼロサム)
対戦者の利得の総和が0である
有限
局面状態数が有限数である(駒数および升数が有限数のため組み合わせも有限)
確定
さいころやルーレットのような確率的な遷移過程ではない
完全情報
互いのプレイヤーに与えられていない情報がない。情報の均衡
将棋・囲碁・オセロ・チェス・連珠など多くの二人テーブルゲームが含まれる
- 5. 探索の種類
Min-Max法
具体的な計算手法にアルファベータ法など
評価値が間違っていなければ探索範囲内では必ず最善手となるが,探索前に評価値を決
定する必要がある
手が進んだ先の局面から探索をはじめる
モンテカルロ探索
発展形にモンテカルロ木探索など
評価しづらい局面であっても探索は可能(原理的には勝敗判定のみで動作する)
現局面から探索をはじめる
二人零和有限確定完全情報ゲームに限らない
- 9. モンテカルロ木探索(Monte Carlo tree search)
基本原理は古いが,Rémi Coulomにより2006年命名・実証された
囲碁AI Crazy Stone
精度の低いモンテカルロ探索をベースに桁違いのパフォーマンスで有望な手を発見可能
大きなブレイクスルー!!
以後,大きな発展のベースに