状態表現
状態
の
潜在表現
良い状態
表現
(
Bohmer
et al.,
2015
)
マルコフ性
をもつ
→現在の状態表現だけで
行動
に十分な情報が要約されている
方策
の改善に利用できる
学習した
価値関数
を
汎化
できる
低次元
である
最近では
ロボティクス
分野のarXivで
潜在空間
を上手く利用した研究をちらほら見かけるようになってきた.これまでは早稲田大学の
尾形研究室
のグループでよく行われていたイメージがある.
https://twitter.com/Georgekt0927/status/1109802174836400128