empowerment
日本語訳は有能感?
道具の使い方の学習に有効?
うまく使えると対象をよく支配
state$ sにおけるempowerment
$ \mathcal{E}(s) = \max_{a, s^{\prime}} \mathcal{I}\left(s^{\prime} ; a | s\right) = \max_{s^{\prime}} \left[ \mathcal{H}\left(s^{\prime} | s\right) - \mathbb{E}_{p(a | s)} \left[ \mathcal{H}\left(s^{\prime} | a, s\right) \right] \right]
from Policy Information Capacity: Information-Theoretic Measure for Task Complexity in Deep Reinforcement Learning
今の状態で、自分の行動によってどれだけ自由に将来の状態を操作できるか
第一項
将来の状態の多様性
高いほどempowerment高い
第二項
エージェントが行動したときの将来の状態の多様性
全ての行動に対して平均している
低いほどempowerment高い