バックギャモンの世界をAIがどう変えたか

2022年5月2日 11:49

この文章は、卓上ゲーム全般における人間vsAIを語る本のために数年前書いたものです。その本が頓挫したため、お蔵入りになっていたものを今回アップします。
基本、『バックギャモンブック』という本の中のコラムに書かれていたことで、そこにネットで拾った情報を追加しようとした記憶があります。コラムの著者名は、この『ブック』が今手元で見つからないので確認できず。昨日ご連絡いただいた元世界チャンプ望月正行さんだった可能性が高いと思います。

バックギャモンとは

バックギャモンは、西洋すごろくとも呼ばれるボードゲームだ。

１対１で行われ、２人が盤の両方向から、15個ずつの駒を、２つのサイコロを振って出た目の数だけ動かす。たがいにすれ違って、全部の駒が反対側に到達すると上がりになる。すれ違うときに、相手の駒をブロックしたり、はじき飛ばしたりできて、それがテクニックになる。

麻雀と同じくらいの技術と運のバランスだと言われる。すべてがサイコロの目しだいなので、見た目としては麻雀より運まかせに見える。しかし実際に多数回プレイすると、麻雀より技術介入度が高いように感じられる。

日本でのプレイ人口は多くないが、西洋ではギャンブルの一種目として広く行われており、世界で３億人がプレイしている。日本のすごろくもバックギャモンが６世紀に伝来してルーツになったものだ。われわれが子ども時代にやったすごろくは、ルールが違っているのだが、それは中世から近世あたりに変化したらしい。

さて、ゲームの説明はいいとして、AIの話をしよう。サイコロの目の数だけ進むゲームなので、AIで扱いやすい。

AIが人間を凌駕するまで

バックギャモンのプログラムはかなり昔からあった。当然ながら昔は人間の方が圧倒的に強く、革命的な存在となったのは1990年代初頭にIBMによって作られたTD-Gammonだった。これはニューラルネットを用いて成功した初めてのバックギャモンプログラムだった。つまり機械学習を活用したのだ。

機械学習、そして深層学習（ディープラーニング）は今ブームになっており、近年の将棋AIや囲碁AIも深層学習を使った成果だ。だがじつはすでに90年代、バックギャモンAIは機械学習によって人間のトップレベルと互角のレベルまで到達していた。

それ以前のバックギャモンプログラムでは、プログラマが評価関数を調整していた。つまり、いってみるなら人間の強者が正しい手を教えていた。だがTD-Gammonではルールのみが与えられ、評価関数の調整は自動化された。自己対戦を150万ゲームプレイする中で、正しい手を発見していき、最終的には当時の最強プレイヤーに近い水準まで到達した。自己学習して強くなれることにAIの脅威が感じられる。

バックギャモンAIの進化は続く。1994年にはJelly Fishというプログラムが発売され、そのころから、プログラムを使って勉強することが一般的になっていった。世界選手権で優勝した選手がJelly Fishを使って徹底的に勉強していたことは、当時のトッププレイヤーの意識を大きく変えた。

90年代を通じて、TD-GammonやJelly Fishの複数のバージョンとトップクラスの人間との対戦は何度か行われ、ほぼ互角の結果だった。90年代終わりから2000年代初頭にかけて、プログラムが人間のトップを凌いだというのが共通認識になっている。

90年代、すでにオセロでは人間の最強者よりプログラムの方が強くなっていた。90年代とはそんな時期だった。だが、ボードゲーム全般としては、まだ危機感はそこまで強くなかった。

チェスの世界王者カスパロフがIBMのコンピュータ・ディープブルーに敗れたのは1997年のことだった。これは世界的な大ニュースとなり、コンピュータはついにここまで来たというメルクマールとなった。バックギャモンでの人間vsAIの戦いも、そのころ決着がついた。

エラーレートの登場

ただ勝ち負けだけではなく、AIはバックギャモンの世界に革命的な変化を及ぼした。1998年にSnowieというAIが発売され、一手ごとにエラーレートを示せるようになっていた。エラーレートとは、プレイヤーの差した初手から最終手までを判定して数値化し、犯したエラー値を合計して、手数で割ったあとに100倍したものだ。人間の最高レベルは2.5～3.0であり、大きな国際大会の上級クラスは6.5程度とされている。

エラーレートの登場により、プレイヤーの実力を数値的に示すことが可能になった。それはバックギャモンというゲームに地図が作られたようなものだった。それ以前は、バックギャモンの実力を判定する方法は投票か大会しかなかった。投票には主観が混ざる。そして個々の大会での成績を積み重ねて長期成績を示すといっても、強者が集まる大きな大会は頻度が高くない。だいぶ時間がかかる。また運による誤差の振れ幅も大きい。

それまで最終結果の統計的な処理しかなかったバックギャモンの実力判定に、一手ごとのエラー値を出すという革命的な性能を持つAIの登場によって、その人の実力が全体の中でどの程度であり、最強水準までの距離も測れるようになった。

ところで、エラーレートを導入したAIであるSnowieという名前に見覚えはないだろうか。今、ポーカーの２大ツールとなっているのは、piosolver（ピオソルバー）とPokerSnowie（ポーカースノーウィー）だ。その後者と同じ名前なのである。同じ会社から発売されている。バックギャモンAIで成功し、その後ポーカーAIを発売したのである。

ポーカースノーウィーは、ポーカーを学習するプレイヤーに巨大な影響を及ぼしているAIだが、バックギャモンでの影響はそれ以上だった。スノーウィーによって、プレイヤーの強さを判定する新たな概念が登場し広まっていった。

以前、麻雀もいずれエラーレートによって実力が判定されるようになるという予測を書いたことがあるけれども、それはバックギャモンという先例があったから思ったことだ。

卓上ゲームはみな「敗者のゲーム」なのか？

エラーレートは、理論的にはまったくエラーを犯さなかったら0になる。このとき、バックギャモンは「敗者のゲーム」であることが形として示された。

つまり、神がバックギャモンをプレイしたとすると、すべて100点の手を指す。人間は、どんな強者であってもミスを犯し、たまに80点の手や70点の手を指してしまう。そのミスの質と量がそのプレイヤーの強さを決める。すなわち、ボードゲームは減点法の世界なのである。

スポーツでは、たとえば野球で時速200キロの剛速球を投げるピッチャーが登場することは理論的に不可能ではない。すると、プレイヤーは長所を伸ばす戦い方ができることになる。100点満点の世界ではなく、120点を取ったり150点を取ることも可能で、つまり満点という概念はない。バックギャモンは違う。100点以上の手は存在せず、どれだけ減点されないかの世界となる。

ただし、手の点数を示すのはAIなので、AIが進化して強くなることで、従来は100点とされていた手が90点に格下げされ、別の手が100点だと示されるバージョンアップはありえる。その時代で最強のAIが満点を決めることになる。バックギャモンは比較的直線的なゲームなので完全解析されちゃいそうな気がするけど、将棋はそこまで直線的なゲームではなく、完全解析は夢の世界であり、これが永久に満点であるという数学的な証明がなされそうな見込みはない。

なお、ボードゲームすべてが減点法の世界なのかは不明だ。囲碁将棋は減点法の世界だという合意がすでにできていると思う。麻雀ではそういった合意はない。それどころか、流れ派のプレイヤーが今も堂々と生き残っているのが麻雀だ。なんという原始的な世界なのか。心が洗われる。

ここから先は麻雀の話になるので、それは別の記事にします。

バックギャモンはサイコロを振るけど隠されている情報はないところが麻雀とは違う。そしてサイコロの目として何が出るかは確率的に偏りがある(7が一番多い)。つまり相手の手牌が見えている上でツモも予測できる部分がある世界ではある。 https://t.co/09bYYZaXW2
— 小林聡 (@koba0367) May 2, 2022

素敵な世界だなぁ
☺️ https://t.co/dCVn6Yq9TK
— ぷらちゃん。 (@plum_m_m) May 2, 2022

ここから先は

0字

目標は毎日17時に更新ですけど、本当に実現できるか自信ないので、公約としては月に15回以上更新です。個別記事は100～300円で、それを月1000円で一括購入できます。

たそがれ麻雀放浪記

¥1,000 / 月

自分が打った麻雀の話、業界ウォッチング、Mリーグ観戦記、麻雀というゲームに関する考察など、オンレート/ノーレート、日本/外国、麻雀の現在/…

ログイン

この記事が気に入ったらサポートをしてみませんか？