7762aa93ff14004
http://nhiro.org.s3.amazonaws.com/6/b/6bc5c4602086f34936438511dbc7a84f.jpg https://gyazo.com/6bc5c4602086f34936438511dbc7a84f
7762aa93ff14,003 7762aa93ff14,005
7762aa93ff14
(OCR text)
5
Stratified K Fold
train.csvは各クラスごとにデータが並んでいた
→単純に分割してテストデータにしてはいけない
→Scikit-learnが色々な方法を提供している
例: StratifiedKFold :クラス比率を保つように分割
def do_cross_validation () :
model =
make_model()
cross_validation.StratifiedKFold (ys)
cross_validation.cross_val_score(
model, xs, ys, cv=cV, scoring='log_loss')
print("Accuracy: %0.2f (+/- %0.2f)"
% (scores.mean (),
CV =
Scores
-
2))
scores.std().
http://scikit-learn.org/stable/modules/cross_validation.html#cross-validation
Nearest: 7762aa93ff14,011