AlphaGo - らぎメモ

AlphaGo

DeepMindが開発したゲームAI

2016年にプロ棋士に大きく勝ち越したことでインパクトを与えた

モンテカルロ木探索に深層強化学習を組み合わせている．

盤面から勝率を計算するためにバリューネットワークやポリシーネットワークが用いられている．

発展系としてAlphaGo ZeroやAlpha Zeroがある