AlphaGOにまた驚かされました。でも人間に勝利した前回より、今回の驚きのほうが本質的にヤバい。
そして新しいヴァージョンになり、よりパワフルになった「AlphaGo Zero」が、2017年10月18日(米国時間)に発表された。AlphaGo Zeroは、これまで以上に人々を驚かせることだろう。テストでは、イ・セドルに勝ったヴァージョンを100回も完膚なきまでに打ち負かし、2000回を超える対局のなかで独自のアイデアを生成し始めている。
イ・セドル氏に勝った旧AlphaGOと対戦して、Zeroは100連勝したという。もう人間ではZeroを負かすのは到底むり。でもそこじゃなくて……
AlphaGo Zeroという名称は、囲碁をするにあたって人間の知識を一切必要とせず、自己対局のメカニズムだけでつくられていることから付けられた。ソフトウェアは最初にランダムな動きを複数回行う。これはどんなときに試合に勝ち、どんなときに負けるかを知るため、そして勝ちやすい手を打てるように調整するためにプログラミングされたものである。発売されたばかりの『Nature』誌の記事では、AlphaGo Zeroが2900万回もの自己対局を通じて、いかに地球上で最も手強い囲碁プレーヤーになったかが描かれている。
ここですね、ヤバいの。Zeroは囲碁のルールしか教わってないんです。旧AlphaGOは人間の対局データから基礎を学んでそこから成長していったわけですけど、Zeroはひたすら自分相手に1人で打ってみて、こう打つと強い、ってのを見つけ出していったわけです。
例えて言うなら、囲碁という山を登るのに、人間は登山ルートを長年かけて開拓してたわけです。そこに旧AlphaGOがやってきて、人間のルートを参考にしてもっと早く登れるルートを見つけた。しかしZeroは初めから自分だけでルートを開拓したら旧AlphaGOより早いルートを見つけてしまった、というような感じ。
つまり人間の知識というやつがAIに取っては足かせであった可能性があるわけです。定石とは結局、空間的に広い碁盤の時間的にも広い序盤から終盤までの全てを見渡せない人間の編み出した、部分最適化手法に過ぎなかった、ということになりそうです。
これ、AIが他のジャンルに応用されていった時も同じようなことが絶対起こる、ってのがわかってて怖い。AIに政治を任せたい、なんて軽々しく言う人がいるけど、任せたらきっと連中とんでもない政策を次々出してきますよ。理解できない(けどなぜかうまくいく)ものを信じるしかなくなる。それって宗教だ。やっぱAIが新しい神なんですかねぇ。