強化学習
機械学習の方法の一つ。
教師あり学習のように単純な正解・不正解といった教師データを与えるのではなく、行動とその行動に対する価値を与え、どのような行動をするのが価値を一番得られるのかを学習する。
具体例
株の売買
単に株価が上がるのか下がるのかを予想するのではなく、どのタイミングで売ると一番の利益を得られるかの予想が必要になる。
AlphaGo(囲碁や将棋)
どの手を打つと、結果的に一番勝ちそうかを推測する。
参考
Platinum Data Blog by BrainPad 強化学習入門~これから強化学習を学びたい人のための基礎知識~ 2019/12/10
http://blog.brainpad.co.jp/entry/2017/02/24/121500
#テーマ5