大槻知史の「最強囲碁AI アルファ碁解体新書」を読了。といってもかなりの速度で要点だけを飛ばし読みした感じです。アルファ碁に関して開発者が発表している2つの論文を読み解いて解説しているものです。結局、アルファ碁(Master)とは何かというと、モンテカルロ木探索をベースにし、それに16万局に及ぶ高段者の棋譜を学習させてSLポリシーネットワークというのを作り、「次の一手」の高段者との一致率を50%以上まで上げ、更に自己対戦による教科学習で強さを上げていくことなのかなと思いました。アルゴリズムの細部はもう歳なのでついていけませんし、興味もあまりありません。一点この本で初めて知ったのは、アルファ碁がともかくも囲碁における、これまで不可能と言われていた「評価関数」を完成させたということです。そもそも「評価関数」が不可能だったからこそのモンテカルロ法だった筈で、その両方をやっていたのには驚きました。アルファ碁、Masterの棋譜を見て感心するのは形勢判断が人間より優れていて負けていれば勝負手を放つし、勝っていれば無理せずに収束に入るという点で、これが正確な局面評価に基づいているのだということがわかりました。でも、この本にも書いてありますが、私はアルファ碁、Masterが本当にプロ棋士を完全に超えたかという点については疑問に思っています。まだかなりのマシンリソースを必要とし、プロ棋士が納得の行くまで何度も対戦するという環境にはなっていません。そういう環境が与えられればプロ棋士がアルファ碁の「穴」を見つけることは十分あり得ることだと思っています。ましてやアルファ碁が「神の領域」に達したとはまったく思いません。所詮は人間の棋譜の学習にかなり依存して作られたソフトであり、人間が100のうちの2、3であれば(故藤沢秀行名誉棋聖の見解です)、4、5ぐらいになったというレベルだと思います。