過学習
モデルが誤差項(再現性がない完全にランダムな部分)を再現しようとしてしまう状況。
回帰問題
では、データは"決定的な関数"と"再現性が無い誤差項(ノイズ)"の和算で生成されると考えている。モデルが再現したいのは、前者の"決定的な関数"であり、ノイズを覚えてもなんの意味もない。これを再現しようとしてしまう状況。
#テーマ5
大学4年間のデータサイエンスが10時間でざっと学べる , 久野 遼平 (著), 木脇 太一 (著), KADOKAWA (2018/3/29)