Qwen-Image-Editで勝手にズームイン/アウトが発生する
https://gyazo.com/9f693aa617e268e1160fe23bb6df4999
先に正方形にpaddingしておくと発生しない…(´ε`;)nomadoor.icon
https://gyazo.com/9612160abdc180b6fb106400bc67b6d5
総ピクセル数を1Mにリサイズしてから、その画像をVAEエンコード & Qwen2.5 VLで画像理解
このノードを使うと勝手にリサイズされるためKSamplerに入力するLatentのサイズが1Mピクセルじゃないと出力画像がおかしくなる
が、上の症状は長方形の画像も1Mピクセルにリサイズしているので関係ないnomadoor.icon
そもそも1Mピクセルにこだわる理由無くない…?
1.5Mにしても問題ない、むしろ順当に綺麗に編集される
issue投げた
1Mピクセルに合わせても長方形の画像を入力したとき勝手にズームイン・アウトすることがある
ChatGPTさんと話した所、VAEの圧縮率が8倍なのに対し、Qwen2.5-VLのパッチサイズ14なので、ここに不整合が生じる(らしい)
https://gyazo.com/71eaa41d3d7a1b24d18bd0257e216b36
なので、画像の解像度を8と14の最小公倍数である56に丸めれば良い
https://gyazo.com/b0e7708d67718c7716839c89d6c4416c
うまくいっているようには見えるnomadoor.icon
が、結局リサイズしたあと更にTextEncodeQwenImageEditノードで1MPへのリサイズが行われてしまうのでうまくいかないこともある
その他参考
本筋とは関係ないが、SpotEditでピクセルシフト出てないのはどうやってるんだろうと思ったけど、どうやら正方形の画像を使えということらしいnomadoor.icon 内部パラメータがちょこちょこズレていくのが原因なのだろうが、どのノードも端数がでてしまってるっぽいので、まあ、結局1024×1024の正方形使えば間違いはないかなあという感じnomadoor.icon