因果
因果推論
を
強化学習
で解く試み。ある
交絡因子
(関係を持つと予想されるA/B双方に影響を与える因子)を含む
因果関係
について、情報収集=>
関係
に関する回答(正当で来たら報酬)というタスクを通じ学習する.
model-free
のエージェントによる
経験
から
メタ
モデル(
RNN
)を学習する
meta learning
の構成をとる。
https://t.co/7ZAtVt7cuj