trl.SFTTrainer
https://huggingface.co/docs/trl/sft_trainer#trl.SFTTrainer
transformers.Trainer
を継承したクラス
SFTTrainer初期化時
train_dataset と eval_dataset を渡せる
trl.SFTConfig
も渡せる
max_seq_length(など)はSFTConfig経由で渡すようになった
compute_metrics
evalに対して(TODO)
callbacksも渡せる
trainは
transformers.Trainer
のtrainを呼ぶ
https://github.com/huggingface/trl/blob/v0.9.6/trl/trainer/sft_trainer.py#L451