🦊HunyuanVideo
参考
推奨設定値
解像度
720P (1280×720)
最大フレーム数
129f (5秒 × 24fps)
(4n + 1)f 推奨
モデルのダウンロード
code:model
📂ComfyUI/
└── 📂models/
├── 📂diffusion_models/
│ └── hunyuan_video_t2v_720p_bf16.safetensors
├── 📂text_encoders/
│ ├── clip_l.safetensors
│ └── llava_llama3_fp8_scaled.safetensors
└── 📂vae/
└── hunyuan_video_vae_bf16.safetensors
text2video
workflow
https://gyazo.com/49d2d23fe7d75ad749aa216aa9b7820d
🟪モデルの選択
Out of memoryになる場合はweight_dtypeをfp8に
これによって同時に処理するフレーム数を削減できるため8GBのVRAMでも生成可能です
image2video
モデルの追加ダウンロード
code:model
📂ComfyUI/
└── 📂models/
├── 📂diffusion_models/
│ ├── hunyuan_video_image_to_video_720p_bf16.safetensors
│ └── hunyuan_video_v2_replace_image_to_video_720p_bf16.safetensors
└── 📂clip_vision/
└── llava_llama3_vision.safetensors
workflow
https://gyazo.com/477ee6c97baa06d5edf008ae5c560c1e
🟪v1はより創造性のある動画になる
🟪v2はv1の改良、というよりはunconditional branchを入力画像の埋め込みで置換したことによってより、入力画像に忠実になったモデル
https://gyazo.com/ed94655ea2194f39a4fa5c785190f266https://gyazo.com/301808480416cdf75eea528eb7373e58https://gyazo.com/44eb89b4c562e1d93fc544c995df4f05
input / v1 / v2
🟦これとは関係ないのだけれど、生成した動画の序盤のフレームの質が下がる傾向にあるので、公式のプログラムでは出力動画の最初の4フレームを捨てています
今回は必要なかったのでバイパス