過学習
過剰適合・オーバーフィッティングともいう
過学習の原因
特徴量がデータ数に対して多い
本質でないデータまで合うように学習しようとすること
モデルの関数が複雑である
少数のデータから難しいことを決めようとすること
特徴量間に相関がある
過学習の軽減策
データを増やす
不要な説明変数を減らす
交差検証を行う
早期終了を行う
ハイパーパラメータを調整する
正則化を行う
アンサンブル学習を利用する