empowerment

日本語訳は有能感？

道具の使い方の学習に有効？

うまく使えると対象をよく支配

state$ sにおけるempowerment

$ \mathcal{E}(s) = \max_{a, s^{\prime}} \mathcal{I}\left(s^{\prime} ; a | s\right) = \max_{s^{\prime}} \left[ \mathcal{H}\left(s^{\prime} | s\right) - \mathbb{E}_{p(a | s)} \left[ \mathcal{H}\left(s^{\prime} | a, s\right) \right] \right]

from Policy Information Capacity: Information-Theoretic Measure for Task Complexity in Deep Reinforcement Learning

今の状態で、自分の行動によってどれだけ自由に将来の状態を操作できるか

第一項

将来の状態の多様性

高いほどempowerment高い

第二項

エージェントが行動したときの将来の状態の多様性

全ての行動に対して平均している

低いほどempowerment高い