訓練/検証データへの分割(3)
データセットをアヤメデータとし、分割を行う例を示す。
code:tts4.py
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(
X, # 学習データ
y, # 教師データ
random_state = 42, # 乱数のシード
test_size = 0.25, # 検証用データの割合 ... 最後の引数後のカンマは残しても問題無い
)
print('# わかりやすく並べて表示 ------------------')
print('# 訓練用')
for X_show, y_show in zip(X_train, y_train):
print(X_show, y_show)
print('# 検証用')
for X_show, y_show in zip(X_test, y_test):
print(X_show, y_show)
引数を改行して記述することもできる。
最後の引数の後ろにカンマを付けても問題無い
/icons/hr.icon
※ ブラウザのバックボタンで戻る