逆強化学習
逆強化学習 (Inverse Reinforcement Learning)
方策や軌道のdemonstrationを与え,報酬を推定する
imitation learningでは「手段」を学習するが,こちらは「目的」を学習する
ヒトでいう「あの人何やってるんだろう」という推定
A Survey of Inverse Reinforcement Learning: Challenges, Methods and Progress