ホールドアウト法
1.与えられたデータを訓練用と検証用に分ける。
https://gyazo.com/00ae1127e34b25d592330b5d4bb80bb8
2.$ X_{train}と$ Y_{train}を使ってパラメータ$ wを計算する。(学習する。)
$ w_{λ}=argmin\sum_{i=1}^{n_{train}}(y_{i}-w^τx_{i})+λ||w||_{2}^2
3.$ X_{valid}と$ Y_{valid}を使って$ λに関する平均二乗誤差を計算する。(汎化誤差の近似として) $ MSE_{λ}=\frac{1}{n_{valid}}\sum_{i=1}^{n_{valid}}(y_{i}-w_{λ}^τx_{i})^2
検証用のデータを元のデータの分布として利用している。
4.$ MSE_{λ}が最も小さいλを採用
$ λ=argmin MSE_{λ}
デメリット
データがよくないといい結果が得られない。解決策→K-分割法