世界モデル
エージェントが得られる情報に基づいて周りの世界についての予測モデルを学習して,方策の学習に利用する手法.