Break-A-Scene
https://gyazo.com/4dc052e202d310167efe168c01602f43
他の手法は一枚の画像に対して一つの概念しか学習しない
が、大抵Preference画像の中には複数のオブジェクトが含まれている
それらを個別に制御して画像生成を行えるようにする
https://gyazo.com/2a1ad8e61a2608bdb86ede47778583f7
画像内のオブジェクトに対してユーザはマスクを施す
それとハンドル(text embeddings)を紐づけさせる
オブジェクト毎に分解して再構成
https://gyazo.com/ae4524a5b2edfeadc6f42b3e412fc31f
背景の抽出
https://gyazo.com/d8dc8ec0733ed820c0b2e14a55a059e0
構成要素を保持したままバリエーションを増やす
https://gyazo.com/d7fa09bb4a0cb2beb391656628a3fb48