Qwen-Image-Edit-2511-Multiple-Angles-LoRA
96の正確なカメラポーズ - カメラ位置の正確なコントロール
3000+のトレーニングペア - 最大精度のための大規模データセット
ガウススプラッティングデータ - 空間理解の向上のための3D一貫性トレーニング
https://gyazo.com/a0f48b88500143feabc09a0cf762e9da
規定のプロンプトフォーマットに従う必要がある
https://gyazo.com/208b1cf6389a9511654894d3dfbe1bcbhttps://gyazo.com/172b41459cef9cacc87786b7ae7c7810https://gyazo.com/c1dbc62652fc9e4d1c2c01cfb69c2a58
input
$ <sks> right side view eye-level shot close-up
$ <sks> front-left quarter view low-angle shot close-up
が、このプロンプトを一々調べるのは大変なので、素敵なUIが開発された
↑ のComfyUI移植
https://gyazo.com/98dbe8e6289eea120b9b8bf4a70f59f2
そのカメラ位置にあったプロンプトを吐き出すだけなので、そのままTextEncodeにつなげる
default_prompts を true にすると、Qwen-Image-Edit-2511-Multiple-Angles-LoRA 用の96個のプロンプトのうちのどれかになる。
とはいえ、別にどちらでも問題なく効く。<sks> 無くても効くnomadoor.icon
true : back-right quarter view elevated shot medium shot
false : back-right view, bird's eye view, medium shot (horizontal: 153, vertical: 61, zoom: 5.0)
https://gyazo.com/205beed3bd2a7cd5838eac1b4e447e23
まあ、単に編集指示を追加したってことよね…nomadoor.icon
とはいえ便利
https://gyazo.com/63ccc2116ecd1e91bd7946ff86af253e
LoRAの重みを下げたり、プロンプトちょっと追加したりしたけど、成功率はとても低いnomadoor.icon
参照あり画像編集として学習して無いだろうしね…
Qwen-Image-Edit自体、雑に画像複数枚投げて、これ参照してくれ~だとうまくいかない
テキストの比率が結構重いので、具体的に指示出して上げる必要がある