強化学習とアクティブラーニングとふりかえり
以前スマホがなかった時代は、旅行先など知らない土地で、「このへんにはこれがあるはず」という予測を立ててとりあえず歩いて探してみる、ということをよくやっていた
いまはすぐマップを検索して正解を調べてしまう
これである種の能力がだんだんなくなっていってる気がする
とりあえず現在の知識を用いて行動してみて、結果をもとにその行動を評価して方略を更新していく、というのは、強化学習そのもの 「正解」がすぐに得られない時代には、そういう学習を嫌でもすることになっていたはず