訓練／検証データへの分割（３）

データセットをアヤメデータとし、分割を行う例を示す。

code:tts4.py

from sklearn.datasets import load_iris

from sklearn.model_selection import train_test_split

X, y = load_iris(return_X_y=True)

X_train, X_test, y_train, y_test = train_test_split(

X, # 学習データ

y, # 教師データ

random_state = 42, # 乱数のシード

test_size = 0.25, # 検証用データの割合 ... 最後の引数後のカンマは残しても問題無い

)

print('# わかりやすく並べて表示 ------------------')

print('# 訓練用')

for X_show, y_show in zip(X_train, y_train):

print(X_show, y_show)

print('# 検証用')

for X_show, y_show in zip(X_test, y_test):

print(X_show, y_show)

引数を改行して記述することもできる。

最後の引数の後ろにカンマを付けても問題無い

/icons/hr.icon

※ ブラウザのバックボタンで戻る