RL
強化学習 これだけは知っておきたい 3 つのこと - MathWorks
1. 環境の作成
2. 報酬の定義
3. エージェントの作成
方策:NN, Q値テーブル?
学習アルゴリズム
4. エージェントの学習と検証
報酬信号、方策アーキテクチャ、サンプル効率
5. 方策の展開
再学習、学習設定、 強化学習アルゴリズムの構成、 方策表現、 報酬信号の定義、 行動信号および観測信号、 環境のダイナミクス