self-play
同型の
agent
と
相互作用
/
対戦
して学習
内部モデル
上で
環境
をシミュレートして学習