強化学習
強化学習とは簡単に言うと「機械(マシーン)がとる行動の戦略(指針)を強化(改善)する仕組み」を学ぶ手法でる。
一連の行動をとった結果ごとに報酬を設定し、その「報酬が最大化」するように機械が試行錯誤して、学習することで精度をあげる。
つまり、自分でどんどん学習していくイメージ。
似た例として、自転車に乗れるまでのプロセスをあげる。
乗ってみる
倒れる
乗り方をかえる(強化学習の”戦略”)
少し乗れる(強化学習の”報酬”)
さらに乗り方を変えて徐々に乗れるようになる
この試行錯誤の繰り返しで最終的にスイスイ乗れるようになる
参考文献
AINOW https://ainow.ai/2019/11/26/180809/
#テーマ4