DQN
強化学習
の1手法
Qは
Q関数
行動価値観数の関数近似に
CNN
を用いている