7762aa93ff14004
http://nhiro.org.s3.amazonaws.com/6/b/6bc5c4602086f34936438511dbc7a84f.jpg https://gyazo.com/6bc5c4602086f34936438511dbc7a84f
(OCR text)
5
Stratified K Fold
train.csvは各クラスごとにデータが並んでいた
→単純に分割してテストデータにしてはいけない
→Scikit-learnが色々な方法を提供している
例: StratifiedKFold :クラス比率を保つように分割
def do_cross_validation () :
model =
make_model()
cross_validation.StratifiedKFold (ys)
cross_validation.cross_val_score(
model, xs, ys, cv=cV, scoring='log_loss')
print("Accuracy: %0.2f (+/- %0.2f)"
% (scores.mean (),
CV =
Scores
-
2))
scores.std().