LTX-Video - work4ai

LTX-Video

https://www.lightricks.com/Project

https://github.com/Lightricks/LTX-VideoLightricks/LTX-Video

https://huggingface.co/Lightricks/LTX-VideoLightricks/LTX-Video

LTX-Videoは、リアルタイムで高品質な動画を生成できる初のDiTベースの動画生成モデルです。このモデルは、768x512の解像度で24FPSの動画を、視聴する時間よりも速く生成することが可能です。多様な動画を含む大規模なデータセットで訓練されており、現実的で多様なコンテンツを持つ高解像度の動画を生成できます。

https://blog.comfy.org/p/ltx-video-095-day-1-support-in-comfyuiComfyUIが対応した

https://docs.comfy.org/advanced/ltxvドキュメント

https://github.com/Lightricks/ComfyUI-LTXVideo/#example-workflowsComfyUI-LTXVideo

モデル自体はデフォルトで対応しているが、LTXV用の便利ツールが公式から出ている

2025/7/16 0.9.8

https://huggingface.co/Lightricks/LTX-Video/tree/mainLightricks/LTX-Video

ltxv-13b-0.9.8-dev

ltxv-13b-0.9.8-distilled

ltxv-13b-0.9.8-dev-fp8

ltxv-13b-0.9.8-distilled-fp8

ltxv-2b-0.9.8-distilled

ltxv-2b-0.9.8-distilled-fp8

ltxv-spatial-upscaler-0.9.8

ltxv-temporal-upscaler-0.9.8

ライセンスがかなり緩和されており、基本的には違法な事しなければ(実質的な)制限なさそう(過去に遡って改編できる旨も書いてなさそうなので他のモデルの学習素材とかにも使えそう？)morisoba65536.icon

ただしllamaよろしくホスティングする際には売上が一定量超えたら有料化する奴はついている(概ね競合他社がホスティングするのを防ぐ為のライセンスと思われる)

2025/5/6 LTXVideo 13B 0.9.7

https://huggingface.co/Lightricks/LTX-Video/blob/main/ltxv-13b-0.9.7-dev.safetensorsltxv-13b-0.9.7-dev

https://huggingface.co/Lightricks/LTX-Video/blob/main/ltxv-13b-0.9.7-dev-fp8.safetensorsltxv-13b-0.9.7-dev-fp8

https://huggingface.co/Lightricks/LTX-Video/blob/main/ltxv-spatial-upscaler-0.9.7.safetensorsltxv-spatial-upscaler-0.9.7

https://huggingface.co/Lightricks/LTX-Video/blob/main/ltxv-temporal-upscaler-0.9.7.safetensorsltxv-temporal-upscaler-0.9.7

2025/4/15

https://huggingface.co/Lightricks/LTX-Video/blob/main/ltxv-2b-0.9.6-dev-04-25.safetensorsltxv-2b-0.9.6-dev

https://huggingface.co/Lightricks/LTX-Video/blob/main/ltxv-2b-0.9.6-distilled-04-25.safetensorsltxv-2b-0.9.6-distilled

2025/3/5

v0.95でキーフレームとビデオ拡張機能に対応した模様

フレーム補間(generative interpolation)

image2videoテクニックメモ

https://www.reddit.com/r/StableDiffusion/comments/1h1bb0f/comment/lzakm3q/?utm_source=share&utm_medium=web3x&utm_name=web3xcss&utm_term=1&utm_content=share_button

このモデルは動画でトレーニングされているため、完全に綺麗な画像は苦手なようです。そのため、ffmpegを使って画像を処理し、h264コーデックでCRF値を20〜30に設定して圧縮すると良いとのことです。これだけでモデルが画像を認識し、実際に処理を行うようになるようです。