LTX-Video
LTX-Videoは、リアルタイムで高品質な動画を生成できる初のDiTベースの動画生成モデルです。このモデルは、768x512の解像度で24FPSの動画を、視聴する時間よりも速く生成することが可能です。多様な動画を含む大規模なデータセットで訓練されており、現実的で多様なコンテンツを持つ高解像度の動画を生成できます。 モデル自体はデフォルトで対応しているが、LTXV用の便利ツールが公式から出ている
2025/7/16 0.9.8
ltxv-13b-0.9.8-dev
ltxv-13b-0.9.8-distilled
ltxv-13b-0.9.8-dev-fp8
ltxv-13b-0.9.8-distilled-fp8
ltxv-2b-0.9.8-distilled
ltxv-2b-0.9.8-distilled-fp8
ltxv-spatial-upscaler-0.9.8
ltxv-temporal-upscaler-0.9.8
ライセンスがかなり緩和されており、基本的には違法な事しなければ(実質的な)制限なさそう(過去に遡って改編できる旨も書いてなさそうなので他のモデルの学習素材とかにも使えそう?)morisoba65536.icon
ただしllamaよろしくホスティングする際には売上が一定量超えたら有料化する奴はついている(概ね競合他社がホスティングするのを防ぐ為のライセンスと思われる)
2025/5/6 LTXVideo 13B 0.9.7
2025/4/15
2025/3/5
v0.95でキーフレームとビデオ拡張機能に対応した模様
このモデルは動画でトレーニングされているため、完全に綺麗な画像は苦手なようです。そのため、ffmpegを使って画像を処理し、h264コーデックでCRF値を20〜30に設定して圧縮すると良いとのことです。これだけでモデルが画像を認識し、実際に処理を行うようになるようです。