過学習
#機械学習
過剰適合
概要
モデルの複雑さが大きくなってバリアンスガ高くなった状態を過学習という
学習データのはずれ値やノイズまで学習してしまった
モデルの自由度が高いことで起きる
原因
学習データが少ない
特徴量が多い
パラメータが大きすぎる
過学習を避けるには?
モデルをシンプルにする
データセットを学習データと検証データに分割する
ホールドアウト法
交差検証法
AIC
などの情報量基準を用いる
https://youtu.be/vbuJpfF9-UI
https://youtu.be/lo9_iYJ3cjw
バイアスとバリアンスのトレードオフ