Wan2.2
https://gyazo.com/ce24f4139a726fcfda2d2cdfbb18371a
https://wan.video/welcomeProject
https://github.com/Wan-Video/Wan2.2Wan-Video/Wan2.2
https://huggingface.co/Wan-AIWan-AI
https://huggingface.co/Comfy-Org/Wan_2.2_ComfyUI_Repackaged/tree/mainComfyUI向けパッケージ
https://huggingface.co/bullerwins/Wan2.2-T2V-A14B-GGUFA14B-T2VのGGUF
https://huggingface.co/bullerwins/Wan2.2-I2V-A14B-GGUFA14B-I2VのGGUF
https://huggingface.co/QuantStack/Wan2.2-TI2V-5B-GGUF/tree/main5BのGGUF
モデル
Wan2.2-T2V-A14B
480P/720P
5s/24fps(?)
Wan2.2-I2V-A14B
480P/720P
5s/24fps(?)
Wan2.2-TI2V-5B
720P
5s/24fps
MoE採用
https://gyazo.com/e8e38937989c26f6e458c2a114275cad
全体では27Bパラメータになるが、High-Noise Expert(デノイズ前半)とLow-Noise Expert(デノイズ後半)にモデルを分けることにより、実際に推論するための必要VRAMは従来の14Bと同程度になる
cf. SDXL 1.0 Refiner
さらなる圧縮(5Bモデル)
Wan2.2専用のVAEによって64倍圧縮
パッチ化(patchification)層を追加することで4096倍圧縮になり、RTX4090で720P/5sの動画を9分で生成
https://alidocs.dingtalk.com/h5/d?dt_editor_toolbar=true&biz_ver=10&showCommentPanel=false&docId=AJdl6JeGYdPKlke1&from=dingnote&dd_user_keyboard=false&dd_full_screen=true&dontjump=true&utm_scene=team_space&mainsiteOrigin=mainsite&workspaceId=nb9XJ3brYR2xQmyA&docKey=AJdl6JeGYdPKlke1&dentryKey=pLooV1n9GCE8nKm5&type=d#/preview公式のPromptガイド
ライティングやモーション、カメラワークなど指示の仕方が書いてある。
https://www.reddit.com/r/StableDiffusion/comments/1mc67xp/wan22_prompting_guide/書いてる内容は有益なのだがコピペすら何故かできないのでちょっと不便…(多分Canvasにレンダリングとかかなり凝ったオサレなことしてる…)
ライセンス
Apache 2.0
使う
🦊Wan2.2
← Wan2.1
#Alibaba_Group