MMAudio
https://github.com/hkchengrex/MMAudio
hkchengrex/MMAudio
ComfyUIでの実装
https://github.com/kijai/ComfyUI-MMAudio
kijai/ComfyUI-MMAudio
ハイライト
MMAudio は、ビデオやテキスト入力に基づいて同期されたオーディオを生成します。当社の主要なイノベーションは、幅広いオーディオビジュアルおよびオーディオテキストデータセットでのトレーニングを可能にするマルチモーダルジョイントトレーニングです。さらに、同期モジュールは、生成されたオーディオをビデオフレームに合わせます。
Pinokio
でも実装されているようだ