残差強化学習
事前に用意した
モジュール
による
出力
と,
学習
による
方策
との差分を
強化学習
の対象とする手法.