アルファ碁のインパクト
モンテカルロ法からアルファ碁へ:囲碁AI進化史
この草稿を書き始めるにあたってアルファ碁の何がすごかったかをどうしても語っておく必要があると感じた。
当時の囲碁AIの話題と言えば、モンテカルロ法という画期的な手法がでてきてちょうど過渡期だった。
知らない読者のために説明をしておくと、モンテカルロ法というのは膨大なシミュレーションを対局中に繰り返し、自分の手番が優勢か劣勢か(通常、ボードゲームAIで評価関数と呼ばれるもの)を判断してくれる仕組みだ。モンテカルロ法の登場前までは人間がどのような局面が優勢かをAIに教えてあげる必要があった。当時としては画期的なアルゴリズムだった。
といっても精々よくてアマチュアの三段から四段程度と言われていた。囲碁の世界チャンピオンをAIが倒すのはまたまだ先だと思われていた。
それがアルファ碁の登場によって一気に覆されたのだった。しかもアルゴリズムなど詳細は一般人には非公開ときた。アルファ碁は囲碁AI界に颯爽と現れて颯爽と去っていった。
アルファ碁だけなら他のゲームAIとそう変わらないと思われるかもしれない。それまでのAIの常識からしたらそうだ。でもアルファ碁は違った。他の分野への応用の可能性を大いに匂わせるものだった。
アルファ碁の直後くらいにDQNと呼ばれるAIがブロック崩しというゲームでかなりうまくなったことが報じられた。これもアルファ碁の技術を応用した典型例だと言える(厳密にいえばアルファ碁の応用なんじゃなくてディープラーニングを基礎としてる点で同じ)。
でも機械学習の専門家に言わせればディープラーニングが先でアルファ碁があとだ、と言われるかもしれない。でも機械学習からみてもアルファ碁はディープラーニングのポテンシャルを示すのに必要十分な価値があったのではないかと推測する。
それまで囲碁AIに興味を持っていた私だったが、アルファ碁はその興味の幅をAI全般に広げるのに充分すぎるインパクトがあった。
AI認識を一変させた事件:アルファ碁の衝撃
アルファ碁の出現で私のAIに対する認識は一変する。
というのもAIに関する話題が次々に入ってくるようになったからだ。
まず未知のAI、アルファ碁に対する興味が強かった。
というのも、いきなり囲碁AIの世界に現れて、世界を一変させてしまったからだ。
今でも中々いい本だと思うので読んでみて欲しい。
ディープラーニングブームと「分類AI」の成長
アルファ碁がもたらしたディープラーニングブームでとりわけすごかったのが分類AIの世界だった。
これは「教師つき学習」と呼ばれる今でも主流の方法を用いて画像を分類するタスク。
記憶に新しいところでは、おそ松さんのキャラクターを分類するタスク。
その頃のAIといえば、人間が頑張ってラベル付けしたデータを学習させて、その学習を元に未知の画像に対しても分類できるといったもの。今振り返れば大したことないのだが、それでも精度が圧倒的に上がったと話題だった。
当時のAIはまだまだ時系列データの処理が苦手と言われていた。
評価関数不要の時代へ:ディープラーニングの本質
アルファ碁を起点とするディープラーニングは何がすごかったか。聞いた話によるとディープラーニング以前は人間が特徴量を定義してあげる必要があった。たとえばオセロAIでは人間が黒が有利なのか、白が有利なのかを数値化する評価関数を定義してあげる必要があった。その上で盤面評価が自分に有利になるように石を置いていた。囲碁AIも含めボードゲームAIならばこの基本は変わらないんじゃないかな。
ところがどっこい、ディープラーニングの出現で人間が評価関数を定義してあげる必要さえなくなってしまった。モデルが自ら有利な盤面を学習するのだ。
このとき私は株トレードにAIを活用できないかしきりに考えたものだ。今思えば、基礎的な知識もないままに思いついた浅はかな発想だったのだが。しかし、それでもAIの進化に対する驚きと可能性への期待感は大きかった。
あの頃は(今もそうだが)AIはものすごいスピードで進化を遂げた。これは一例であるが、日経サイエンスでアルファ碁の特集を取り上げたと思ったら既にアルファゼロの発表が行われているといった感じだった。
DQNと呼ばれるプログラムがブロック崩しで人間よりもうまくなってしまったのもこの頃で、この頃はAIの話題が非常に盛り上がった時期ともいえる。