逆強化学習 - AGI

逆強化学習

逆強化学習 (Inverse Reinforcement Learning)

方策や軌道のdemonstrationを与え，報酬を推定する

imitation learningでは「手段」を学習するが，こちらは「目的」を学習する

ヒトでいう「あの人何やってるんだろう」という推定

A Survey of Inverse Reinforcement Learning: Challenges, Methods and Progress