Break-A-Scene

https://gyazo.com/4dc052e202d310167efe168c01602f43

他の手法は一枚の画像に対して一つの概念しか学習しない

が、大抵Preference画像の中には複数のオブジェクトが含まれている

それらを個別に制御して画像生成を行えるようにする

https://gyazo.com/2a1ad8e61a2608bdb86ede47778583f7

画像内のオブジェクトに対してユーザはマスクを施す

それとハンドル(text embeddings)を紐づけさせる

オブジェクト毎に分解して再構成

https://gyazo.com/ae4524a5b2edfeadc6f42b3e412fc31f

背景の抽出

https://gyazo.com/d8dc8ec0733ed820c0b2e14a55a059e0

構成要素を保持したままバリエーションを増やす

https://gyazo.com/d7fa09bb4a0cb2beb391656628a3fb48