交差検証法
cross validation法
過学習を回避する為にデータを学習と予測とに分けて予測データを使ってモデルを評価することで未知データでの精度を確かめる 擬似的に未知データをつくっている
学習データが多いとき。シンプル
k分割交差検証法
データ数が多いとき。ホールドアウトよりは複雑
https://gyazo.com/320379d2e4d6338c9ab51294da86e008https://gyazo.com/9405dd29f30df04c4f9785c54df258f1
Leave one out法
データ数が極端に少ない場合
https://youtu.be/14BKdzNu_QU
scikit learnで実装
cross_val_scoreを使用
code:python
from sklearn import linear_model
clf = linear_model.LogisticRegression()
from sklearn.model_selection import cross_val_score
score = cross_val_score(clf, X, y, cv=5)
print(f"スコア: {score}")
print(f"平均値: {score.mean()}")