VisualCloze
https://gyazo.com/779fcbca3e9a7188c17e8bc0ed104808
https://visualcloze.github.io/Project
https://github.com/lzyhha/VisualClozelzyhha/VisualCloze
https://huggingface.co/VisualCloze/VisualClozeVisualCloze/VisualCloze
https://arxiv.org/abs/2504.07960VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning
https://gyazo.com/1b9cd431b0eedc114e8bf0f17a85b69a
(数個の)編集前から編集後のペア画像から、それがどんなタスクかを認識し、対応できるようになる
Graph200K でFLUX.1 Fillをファインチューニング
Graph200K
https://gyazo.com/f34b260348f78b015c6c4e23f983c170
Subject200Kを元に、各画像に対して条件生成/画像復元/画像編集/IP 保持/スタイル転送の5つのタスクでアノテーションする
条件画像(N枚)+出力マスをグリッド状にならべ、出力マスをマスクで埋める
inpaintingタスクとして画像を生成する
関連
In-Context LoRA
ACE++
FLUX.1 Kontext