過学習
「過学習(過適合)」とは、学習(訓練)データにあまりに適合しすぎて、学習(訓練)データでは正解率が高いのに学習(訓練)データとは異なるデータ(例えば、評価データ)では正解率が低くなってしまう、つまり、学習(訓練)データだけに最適化されてしまって汎用性がない状態に陥ることです。
未知のデータと遭遇した時に、それまでに学習してきた実力が発揮できない
実際の運用で役に立たない
過学習を抑える方法
学習データの数を増やす
学習データの数が多ければ多いほど、学習(訓練)データのバリエーションが増えていき、未知の「まだ見ぬ」データに近づいていく
モデルを簡単なものに変更する、又は、ドロップアウトする
多層ネットワークの各層のユニットを確率的に選別して、選別したもの以外を無効化する
正則化する
不要なパラメータの影響を小さくすることで複雑なモデルを単純なモデルに変えていく
過学習⇔汎化能力
<参考文献>
AI研究所「AIが学習しすぎる?『過学習』問題とそれを抑制する方法」https://ai-kenkyujo.com/2020/04/24/kagakushu/
(2020/12/21)
#テーマ4