Wan2.2
https://gyazo.com/ce24f4139a726fcfda2d2cdfbb18371a
モデル
Wan2.2-T2V-A14B
480P/720P
5s/24fps(?)
Wan2.2-I2V-A14B
480P/720P
5s/24fps(?)
Wan2.2-TI2V-5B
720P
5s/24fps
https://gyazo.com/e8e38937989c26f6e458c2a114275cad
全体では27Bパラメータになるが、High-Noise Expert(デノイズ前半)とLow-Noise Expert(デノイズ後半)にモデルを分けることにより、実際に推論するための必要VRAMは従来の14Bと同程度になる
さらなる圧縮(5Bモデル)
Wan2.2専用のVAEによって64倍圧縮
パッチ化(patchification)層を追加することで4096倍圧縮になり、RTX4090で720P/5sの動画を9分で生成
ライティングやモーション、カメラワークなど指示の仕方が書いてある。
ライセンス
使う