強化学習 - kyoyo-ds2019-026

強化学習

もう1つ、2016年にGoogleのAlphaGoというAIが韓国の囲碁プロ棋士を破ったという大きなニュースがありましたね。実は、これは強化学習(Reinforcement Learning)という別の学習方法を使って強くなりました。強化学習は、正解を与える代わりに将来の価値を最大化することを学習するモデルです。囲碁のように、必ずしも人間に正解がわかるわけではない場合でも学習できるので、人間を超える力を身につけることが期待されています。

https://products.sint.co.jp/aisia/blog/vol1-9

#テーマ5