A3C
2016
Deep Mind
が発表
早い:AsynchronousかつAdvantageを使って学習させるので、学習が早く進む!
安い:DeepLearningといえばGPUという常識を覆して、安価なCPUだけで計算ができる!
うまい:
DQN
(やその他の比較手法)より性能がいい!
DQNを卒業してA3Cで途中挫折しないための7Tips - Qiita
深層強化学習
において分散並列学習の有用性を示した重要な手法
A3CでCartPole (強化学習) - どこから見てもメンダコ
深層強化学習アルゴリズムまとめ - Qiita