正則化
機械学習モデルは未知データへの予測精度を高めるために訓練データを学習する。
機械学習モデルが訓練データを過剰に学習すると未知データへの予測精度が落ちることがある。
これはモデルが訓練データに対して過剰に学習したため、はずれ値やノイズまで学習してしまったと考えることができる。
このような現象を過学習、またはoverfittingと呼ぶ。
過学習が起きる原因としてデータ数が少ない、変数が多い、パラメータが大きすぎるといったことがある。
この過学習を防ぐための手法として正則化がある。これらの手法はニューラルネットワークの他にもランダムフォレスト、回帰モデルなど様々な機械学習アルゴリズムで用いられる手法である。
URL:https://to-kei.net/neural-network/regularization/
タイトル名:過学習と正則化
Webサイト:to-kei.net