ティコノフ正則化
目的関数に新たな項(正則化)を加える
$ J^T(w)=||Xw-Y||_{2}^2+λ||w||_{2}^2
第一項:損失項(損失関数) 第二項:正則化項(正則化関数)
$ λ>0は適当な数値。
$ \nabla J^T(w)=0
$ \nabla J^T(w)=2X^τ(Xw-Y)+2λw=0
$ X^τX+λI_{n}は正則行列
$ w=(X^τX+λI_{n})^{-1}X^τYこれから導かれる最適解を$ w_{λ}^*とおくと、
$ \nabla J(w_{λ}^*)=-λw_{λ}^*
λを正則化パラメータという。
λが大きすぎると汎化誤差と経験誤差が大きくなる。→未学習
参考文献: UTokyo Open Course Ware https://ocw.u-tokyo.ac.jp/lecture_1827/
#最適化問題