DQN - 角谷鵜技術五十三次

DQN

強化学習の1手法

QはQ関数

行動価値観数の関数近似にCNNを用いている