Model-based
モデルベース
状態遷移モデルを学習し,ダイナミクスの予測・状態予測を行う
パラメータ数,自由度を抑えられる
簡単なタスクなら数十回の試行で学習
サンプル効率向上