残差強化学習
事前に用意したモジュールによる出力と,学習による方策との差分を強化学習の対象とする手法.