逆強化学習
逆
強化学習
(
Inverse Reinforcement Learning
)
方策
や
軌道
の
demonstration
を与え,
報酬
を推定する
imitation learning
では「
手段
」を学習するが,こちらは「
目的
」を学習する
ヒト
でいう「あの人何やってるんだろう」という推定
A Survey of Inverse Reinforcement Learning: Challenges, Methods and Progress