交差検証法
cross validation法
過学習を回避する為にデータを学習と予測とに分けて予測データを使ってモデルを評価することで未知データでの精度を確かめる
擬似的に未知データをつくっている
ホールドアウト法
学習データが多いとき。シンプル
k分割交差検証法
データ数が多いとき。ホールドアウトよりは複雑
https://gyazo.com/320379d2e4d6338c9ab51294da86e008https://gyazo.com/9405dd29f30df04c4f9785c54df258f1
Leave one out法
データ数が極端に少ない場合
https://youtu.be/14BKdzNu_QU
scikit learnで実装
cross_val_scoreを使用
code:python
#線形モデル(ロジスティク回帰)として測定器を作成する
from sklearn import linear_model
clf = linear_model.LogisticRegression()
#Cross Validation
from sklearn.model_selection import cross_val_score
score = cross_val_score(clf, X, y, cv=5)
#正解率を出力する
print(f"スコア: {score}")
#平均値を出力する
print(f"平均値: {score.mean()}")