IP-Composer
https://gyazo.com/b2a36b3247ce5d60c8d22c4a81d65533
https://ip-composer.github.io/IP-Composer/Project
https://arxiv.org/abs/2502.13951IP-Composer: Semantic Composition of Visual Concepts
複数枚の画像を混ぜて、要素が混ざった新しい画像を生成する
基本はIP-Adapterだけども、参照画像の中から流用したい要素(猫のみ、ライティングのみ etc.)を指定できる
https://gyazo.com/9a4c143dacefc89ce2f50bf9de7a17fd
参照画像から抽出する要素をユーザーがテキストで指示、それをLLMがいろんな表現に書き換え、それをCLIPを使ってベクトルに変換し それぞれの参照画像からのベクトルを混ぜ合わせIP-Adapterに流す
類似
Whisk