LTX-Video
https://www.lightricks.com/Project
https://github.com/Lightricks/LTX-VideoLightricks/LTX-Video
https://huggingface.co/Lightricks/LTX-VideoLightricks/LTX-Video
LTX-Videoは、リアルタイムで高品質な動画を生成できる初のDiTベースの動画生成モデルです。このモデルは、768x512の解像度で24FPSの動画を、視聴する時間よりも速く生成することが可能です。多様な動画を含む大規模なデータセットで訓練されており、現実的で多様なコンテンツを持つ高解像度の動画を生成できます。
https://blog.comfy.org/p/ltx-video-095-day-1-support-in-comfyuiComfyUIが対応した
https://docs.comfy.org/advanced/ltxvドキュメント
https://github.com/Lightricks/ComfyUI-LTXVideo/#example-workflowsComfyUI-LTXVideo
モデル自体はデフォルトで対応しているが、LTXV用の便利ツールが公式から出ている
2025/7/16 0.9.8
https://huggingface.co/Lightricks/LTX-Video/tree/mainLightricks/LTX-Video
ltxv-13b-0.9.8-dev
ltxv-13b-0.9.8-distilled
ltxv-13b-0.9.8-dev-fp8
ltxv-13b-0.9.8-distilled-fp8
ltxv-2b-0.9.8-distilled
ltxv-2b-0.9.8-distilled-fp8
ltxv-spatial-upscaler-0.9.8
ltxv-temporal-upscaler-0.9.8
ライセンスがかなり緩和されており、基本的には違法な事しなければ(実質的な)制限なさそう(過去に遡って改編できる旨も書いてなさそうなので他のモデルの学習素材とかにも使えそう?)morisoba65536.icon
ただしllamaよろしくホスティングする際には売上が一定量超えたら有料化する奴はついている(概ね競合他社がホスティングするのを防ぐ為のライセンスと思われる)
2025/5/6 LTXVideo 13B 0.9.7
https://huggingface.co/Lightricks/LTX-Video/blob/main/ltxv-13b-0.9.7-dev.safetensorsltxv-13b-0.9.7-dev
https://huggingface.co/Lightricks/LTX-Video/blob/main/ltxv-13b-0.9.7-dev-fp8.safetensorsltxv-13b-0.9.7-dev-fp8
https://huggingface.co/Lightricks/LTX-Video/blob/main/ltxv-spatial-upscaler-0.9.7.safetensorsltxv-spatial-upscaler-0.9.7
https://huggingface.co/Lightricks/LTX-Video/blob/main/ltxv-temporal-upscaler-0.9.7.safetensorsltxv-temporal-upscaler-0.9.7
2025/4/15
https://huggingface.co/Lightricks/LTX-Video/blob/main/ltxv-2b-0.9.6-dev-04-25.safetensorsltxv-2b-0.9.6-dev
https://huggingface.co/Lightricks/LTX-Video/blob/main/ltxv-2b-0.9.6-distilled-04-25.safetensorsltxv-2b-0.9.6-distilled
2025/3/5
v0.95でキーフレームとビデオ拡張機能に対応した模様
フレーム補間(generative interpolation)
image2videoテクニックメモ
https://www.reddit.com/r/StableDiffusion/comments/1h1bb0f/comment/lzakm3q/?utm_source=share&utm_medium=web3x&utm_name=web3xcss&utm_term=1&utm_content=share_button
このモデルは動画でトレーニングされているため、完全に綺麗な画像は苦手なようです。そのため、ffmpegを使って画像を処理し、h264コーデックでCRF値を20〜30に設定して圧縮すると良いとのことです。これだけでモデルが画像を認識し、実際に処理を行うようになるようです。