AlphaGo
DeepMindが開発したゲームAI
2016年にプロ棋士に大きく勝ち越したことでインパクトを与えた
モンテカルロ木探索に深層強化学習を組み合わせている.
盤面から勝率を計算するためにバリューネットワークやポリシーネットワークが用いられている.
発展系としてAlphaGo ZeroやAlpha Zeroがある