P+
https://gyazo.com/1bf8760f14bd18f122f3d6e3734266c3
通常、テキスト埋め込みはU-netのすべてのレイヤーに同じものが注入される(P) しかし、U-netのレイヤーごとに、影響を与えるトークンの種類が違うということが分かってきた
https://gyazo.com/22497550acbc9973b1665b1df22114b8
画像から分かるように、色は外側のレイヤーに影響され、形は内側のレイヤーの影響を受けている
これをP+として、さらなる応用を研究する
P+解析
https://gyazo.com/3b2e44ca235023e5ebcf87012e390429
https://gyazo.com/49ac1c00262d8007c28fb01617ae5189
レイヤー別にTextual Inversionをする
形やスタイルなど、特定の要素のみに適用できるので、最後の猫がわかりやすいけれど、編集自由度が上がっている スタイルミキシング
https://gyazo.com/0db7904b89f75871588587ec22da3294
スタイルの影響受けるレイヤーと形の影響を受けるレイヤーに別のTexual Inversionを埋め込むだけでT2I-Adapterのスタイルのようなことができてしまう