RL - takalab

RL

強化学習これだけは知っておきたい 3 つのこと - MathWorks

1. 環境の作成

2. 報酬の定義

3. エージェントの作成

方策：NN, Q値テーブル？

学習アルゴリズム

4. エージェントの学習と検証

報酬信号、方策アーキテクチャ、サンプル効率

5. 方策の展開

再学習、学習設定、強化学習アルゴリズムの構成、方策表現、報酬信号の定義、行動信号および観測信号、環境のダイナミクス