Mochy's Backgammon Today

プロプレイヤー望月の日々バックギャモン

バックギャモンBotと人間、比較に意味はあるのか?

2010年10月25日 | 日記

某氏からバックギャモンのBOT(コンピューターソフト)についてメールで質問を受けたので、その返事をブログにも書こうと思います。
無許可だけど、ほとんど僕の返信だから問題ないかなと。

> ・いつ頃から、ソフトのほうが強いと認識されるようになったか
1999年にNack Ballardがコンピューター(多分Jerryfish)と300ゲームの
マネーセッションを行った。毎日50ゲームずつ6日間に分けて勝負して、$2
00/pの公開対局だったと思う。それでNackは60点勝利しました。この勝負は
コンピューターの欠点をついてキューブを大きくしたとかそういうことはなかっ
た。単に彼が強かったんだと思う。(Nackは本当の天才で、ギャモン会の宝です)
しかし、2003年(私がラスベガスで優勝した年)はみんなの共通認
識としてBotは人間より強いと思われていたと思う。
だから、2000年前後ではないかと思います。2001年か、2002年だと
思います。

しかし、1999以降公開対局が行われていないのでハッキリと人間を打ち破っ
た日というのは無く、あくまでなんとなくみんながそう思っている、ということ
です。

> ・どういう理由で、そう思われるようになったか
人間がたくさんいるゲームサーバーで常に上位にいたのは大きかったと思う。
また、コンピューターの言うムーブに逆らっても(プロポジション等)まず勝て
ない。

> ・ソフトを強くしていく過程で、どんなことがあったか
技術的なことは皆上さんや山本さんにきいた方がいいと思いますが、ニューラル
ネットなので自分同士の対戦を繰り返して強くなったはずです。成長が止まっ
たら人間が介在してすこし評価関数をいじり、また対戦を繰り返させる。

それ以前のコンピューターは人間が頑張って評価関数を作っていたはずですが、
めちゃくちゃ弱かったです。

> ・実際のところ、世界チャンピオンクラス(=望月さん)とソフトではどのぐらい差があるのか
eXtreme Gammonの最強設定とやって1ゲームあたり0.05-0.1の間じゃないでしょ
うか。そう言われて考えたのですが、初手53もらえればぎりぎり勝てます。
初手をもらえるだけ(ぞろ目は無し)なら、負けると思います。
まあ、自分にひいき目にみてるかもしれませんね。お金を賭けて勝負しろといわ
れたら、初手61なら絶対やります。

> ・ソフトに明確な弱点はあるか
あります。13枚戻るようなスーパーバックゲームの認識はおかしくて、ほとん
どぶっ壊れます。そういうゲームでキューブを64倍とかにすれば勝てるのでそ
の意味ではコンピューターとマネーをやれば人間が勝てると思う。
そういうトリックを抜かせば勝てないでしょう。

ところで、将棋関係のいろいろな記事を読むと、将棋の人はコンピューターに対してうぶというか、負
けてはいけないというアレルギーがあるのかと思います。
でも、コンピューターが強くなると、人間のレベルはどんどん上がると思いますよ。

たとえばSnowie1と勝負しろと言われたらわたしはやります。多分勝てると思い
ます。私の技術がそれ以降のBOTによってだいぶ進歩したからです。
また、BOTによって創造的なムーブが増えました。自分の引き出しが増えていっ
た感じ。将棋でもそういうことが今後どんどんでてくるんじゃないかな。
BOTは創造しているわけじゃないんだけど、固定観念がないから人間にとっては
面白い手を指すと思いますよ。

あと、これはギャモン特有の話だけど、BOTの一番強いところは常に同じ実力を
出せて、疲れを知らないことだと思う。ギャモンは回数を重ねて勝負してなんぼ
のもんなので、その時に疲れを知らないのは本当に有利です。徹夜のマネーなら
42もらえないとやらない。
逆に弱いのは相手によってアクションを変えられないところや、ブラフを打てな
いところ。だから、リアルトーナメントに出たとしても誰とでも同じアクション
をしちゃう。下手殺しができない。

最後に、BOTを擬人化して人間と比較するのは話題性があるけど、ナンセンスな
ことだと思っています。
たとえば、eXtreme GammonのXGR+ていうのは超早い1ply Rolloutです。
これと勝負してもフェアじゃないと思います。だって同じ局面から何度もやって
結果を平均化しているわけでしょ。そんなのありかよって。考えてすらいないん
ですよ。極端な話、小学1年生だって同じ局面から10000回やらせればそのロー
ルアウト結果がだいたい正しいムーブになりますよ。(Rolloutは恐ろしくて、た
とえ過程のムーブが間違いだらけでも、同じように間違えている限り答えは合う)
2ply 3plyも全部ミニミニロールアウトですね。
本当の勝負は評価関数だけでするべきだと思います。だから、0ply vs 人間なら
わかるんです。(ちなみに、それなら人間が勝てると思います。)
同じ理由で「合議」の将棋BOTもどうかな~と思いますね。それなら人間も合議
するよと。
でも、そんなの意味ないですよね。より強い手を打てるオプションがあるならそ
れを使って、それを含めてBOTとするのが当然です。ただ、それを勝負といって
勝ち負けにこだわる必要はあるのかなと。

自動車と徒競争をするひとはいないわけで、車に乗って楽しめばいいじゃん、と
いうのが私の見解です。

コメント (1)   この記事についてブログを書く
« Fibsでの公開対局終了 | トップ | 下平-Eliペアの優勝動画 »
最新の画像もっと見る

1 コメント

コメント日が  古い順  |   新しい順
Unknown (batcho)
2010-10-25 05:17:17
>徹夜のマネーなら42もらえないとやらない。

笑った。そして勝ちそうな気がしてしまう。

コメントを投稿

日記」カテゴリの最新記事