斉藤康己の「アルファ碁はなぜ人間に勝てたのか」を読了。といっても、斜め読みで、AIの歴史みたいな所はかなり飛ばして読みました。「アルファ碁」とは何かというと、この本によれば、「畳み込みニューラルネットワーク+モンテカルロ木探索」だということです。2000年代に入って囲碁ソフトが飛躍的に強くなったのはモンテカルロ法を採用してからですが、私はいくらコンピューターが進歩したといっても、囲碁の膨大な手数を全部試して勝敗を判定するなんて、一定の時間内に可能なのか、疑問に思っていました。この本によると、モンテカルロ法といっても、全ての手を読んでいるのではなく、ツリー検索と組み合わせて有望そうな手の周辺だけを読んでいるとのことでした。それが「モンテカルロ木探索」です。ここまでは今までの囲碁ソフトも同じですが、アルファ碁の特長はそれに「畳み込みニューラルネットワーク」を組み合わせたことで、KGSというネット碁会所での強い人の棋譜データ16万局分を学習して、「次の一手」をできるだけ正しく打つようにしたものです。この意味でアルファ碁の打ち方は人間の延長戦上にあり、決して突飛なものではありません。実はモンテカルロ木探索無しでも、アルファ碁は80%以上の確率でプロ棋士とほとんど同じ「次の一手」を打つそうです。アルファ碁に悪手が少ないのは「ニューラルネットワーク」のお陰で、また時に人間に理解ができない手を打つのは「モンテカルロ木探索」の結果でないかということです。
この作者は囲碁の実力は10級とのことなので、囲碁の方から見ての深い分析はありません。プロ棋士から見た本として、王銘エン9段の「囲碁AI新時代」が3月15日に発売予定であり、予約しています。
なお、先日たまたまFacebookで「巡回セールスマン問題」の話をしましたが、実はこれを解くアルゴリズムと囲碁ソフトのアルゴリズムは一部共通性があるとのことです。