RLHF
#RL
/villagepump/RLHF
RLHF : Reinforcement Learning from Human Feedback
2023/1 第2週 weekly AI news#63bc4e4ee2dacc0000b0c57d
Midjourney
はどの画像をアップスケール/バリエーションしたかを統計していそう
wogikaze.icon
わかりやすいのでいえばmidjourneyは生成した結果を4つの絵文字でユーザーが評価できる
これで学習しているはず