強化学習とアクティブラーニングとふりかえり

以前スマホがなかった時代は、旅行先など知らない土地で、「このへんにはこれがあるはず」という予測を立ててとりあえず歩いて探してみる、ということをよくやっていた

いまはすぐマップを検索して正解を調べてしまう

これである種の能力がだんだんなくなっていってる気がする

とりあえず現在の知識を用いて行動してみて、結果をもとにその行動を評価して方略を更新していく、というのは、強化学習そのもの

「正解」がすぐに得られない時代には、そういう学習を嫌でもすることになっていたはず

こういうのは不便益

「アクティブラーニング」とか「PBL」とかいってるのは本来はそういうことをしようとしているのだろう

だから、行動を評価するための「ふりかえり」とか「自己評価」とか「フィードバック」とかが本質的に「必要」になる