最適化は変化に弱い
最適化にも欠点がある
構成するパーツが複雑になる
この問題を、強化学習の分野では「探索と利用のトレードオフ」(exploration exploitation tradeoff)と呼びます。「過去の経験から一番良いと思う行動」ばかりをしていたのでは、もっと良い行動を見つけることができません。それは探索が足りないのです。一方、もっと良いものがあるかも!と「未経験の行動」ばかりをしていたのでは、過去の経験が活かせません。それは利用が足りないのです。 たとえば情報源として信頼できる人をSNSでフォローすると、その人の投稿読む時間を、別のおもしろい人を探す時間に充てられない。
探索と利用のトレードオフ、目安となるバランスはあるんだろうか?
:hyuki: 父親の思い出話/インターネットのこと
先ほどふと、今は亡き父親のことを思い出していました。
田舎に住んでいましたけれど、父親は様々なことに根気よく熱心に取り組んでいました。コンピューターをいち早く導入して小さな塾もやっていました。プログラミングやデータ整理なども個人でやっていました。
けれども、インターネットに関してはあまり積極的ではありませんでした。コンピューターウィルスにかかることや、あるいはクレジットカード番号を不正に利用されることなど、かなり過剰に恐れていました。
基本的姿勢としては間違っていませんでしたし、それで何かトラブルが起きたこともありませんでしたけれど、今にして思えばずいぶんもったいないなと思わないではありません。
父親は能力も高く、またITの理解力も高かったので、もしもインターネットにアクセスしていたら、その広い世界で楽しむことができたんじゃないかと思うからです。
新しいものに取り組むというのは怖いものですけれど、トラブルを恐れるあまり、全てをシャットアウトしてしまうと、そこから得られるメリットもなくなってしまうことになります。
難しいものですね。
翻って自分のことを考えてみますと、自分としては新しいものに積極的に取り組んでいきたいと思っていますが、どうしてもそこには、能力的な限界や時間的な限界があるのは確かです。ですから、何らかの意味で見極めが必要なのは確かでしょう。