LTX-2.3
https://huggingface.co/Lightricks/LTX-2.3Lightricks/LTX-2.3
https://huggingface.co/unsloth/LTX-2.3-GGUFunsloth/LTX-2.3-GGUF
ComfyUI対応済み
@ltx_model: Prompting Guide with LTX-2.3
https://pbs.twimg.com/media/HCqpACEW4AE4kMo.jpg
1. 具体的に書く。エンジンがちゃんと扱えるようになった
LTX-2.3 はより大きな・高性能なテキストコネクタを搭載。
2. 描写するだけでなく「演出」する
LTX-2.3 は空間レイアウトや位置関係をかなり尊重するようになりました。
3. 質感・素材をしっかり記述
潜在空間とVAEが刷新され、細部が全解像度でシャープに。
4. 画像→動画なら「動詞」を入れる
2.3 で最大の進化の一つが「固まる」現象の大幅減少と自然な動き。でも動きはまだ明確に指示が必要。
5. 静止画っぽいプロンプトは避ける
プロンプトが静止画のキャプションみたいだと、出力も静止画っぽくなりやすい。
6. ネイティブ縦型を意識して設計
LTX-2.3 は縦型動画(最大1080x1920)をネイティブサポート。縦データで訓練済み。
縦コンテンツを作るなら、最初から縦で構図を考える。
7. オーディオはハッキリ指示
新型ボコーダーで信頼性と唇同期が向上。
8. より複雑なショットが可能に
以前のチェックポイントはシンプルが報われたけど、 LTX-2.3 は「指示の忠実度」が大幅アップ+画質向上で、自信を持って野心的なシーンを作れます。
公式Tips
https://ltx.io/model/model-blog/comfyui-workflow-guideComfyUI Video Generation Model Workflow Guide (LTX-2.3)
https://pbs.twimg.com/media/HEHfzrMWEAATEgY.jpg
LTX DesktopよりComfyUIの方が細かくいじれるオススメ
フルモデルなら50steps、Distilledなら 4 ~ 8steps
CFGは 3.0 ~ 3.5
シネマティックをやりたかったら50fpsがオススメ
1280x720 → アップスケールより 一発 2560x1440 の方が良い
ホントに?nomadoor.icon
I2V
シーン説明はせずに、動きだけ書いた方が良い
CFGは低めが良い
フルモデルなら60 ~ 80stepsあったほうが良い
アスペクト
16:9がオススメ
正方形や縦長は歪みやすい
🅛🅣🅧 Multimodal Guider ノード
ビデオと音声のどちらをどれだけ従わせるかを調整できる
CFG一本ではなく、個別に微調整する
← LTX-2