状態表現
状態の潜在表現
良い状態表現 (Bohmer et al., 2015)
マルコフ性をもつ
→現在の状態表現だけで行動に十分な情報が要約されている
方策の改善に利用できる
学習した価値関数を汎化できる
低次元である
最近ではロボティクス分野のarXivで潜在空間を上手く利用した研究をちらほら見かけるようになってきた.これまでは早稲田大学の尾形研究室のグループでよく行われていたイメージがある.
https://twitter.com/Georgekt0927/status/1109802174836400128