A3C - 角谷鵜技術五十三次

A3C

2016 Deep Mindが発表

早い：AsynchronousかつAdvantageを使って学習させるので、学習が早く進む！

安い：DeepLearningといえばGPUという常識を覆して、安価なCPUだけで計算ができる！

うまい：DQN(やその他の比較手法)より性能がいい！

DQNを卒業してA3Cで途中挫折しないための7Tips - Qiita

深層強化学習において分散並列学習の有用性を示した重要な手法

A3CでCartPole (強化学習) - どこから見てもメンダコ

深層強化学習アルゴリズムまとめ - Qiita