DQN
Deep Q-Network: 深層
Q学習
2013年
に
DeepMind
から発表された
深層強化学習
の基本的な手法.
Q学習
で用いられる
価値関数
や方策を
ディープラーニング
で
出力
する
経験再生
や
ターゲットネットワーク
が導入されている
ノイジーネットワーク
ε-greedy方策
を導入している
行動
の選択と
Q値
の評価を同じ
ネットワーク
で行う場合に,推定値が過大評価される傾向がある.
ダブルDQN
でこれを対応している.