Kandinsky 5.0 T2V Lite
https://gyazo.com/89f6378a863688d7969df43fd79de166
https://ai-forever.github.io/Kandinsky-5/Project
https://github.com/ai-forever/Kandinsky-5ai-forever/Kandinsky-5
https://huggingface.co/collections/ai-forever/kandinsky-50-t2v-lite-68d71892d2cc9b02177e5ae5Kandinsky 5.0 T2V Lite
Qwen2.5-VL および CLIP がテキスト埋め込みを提供
HunyuanVideo 3D VAE が動画を潜在空間にエンコード/デコード
DiT が主な生成モジュールとして、クロスアテンションを用いてテキスト条件付けを行う
Kandinskyブランドそのものは画像生成AIモデルから連番になっている
動画生成モデル