Kandinsky 5.0 T2V Lite
https://gyazo.com/89f6378a863688d7969df43fd79de166
https://ai-forever.github.io/Kandinsky-5/
Project
https://github.com/ai-forever/Kandinsky-5
ai-forever/Kandinsky-5
https://huggingface.co/collections/ai-forever/kandinsky-50-t2v-lite-68d71892d2cc9b02177e5ae5
Kandinsky 5.0 T2V Lite
Qwen2.5-VL
および
CLIP
がテキスト埋め込みを提供
HunyuanVideo 3D VAE
が動画を潜在空間にエンコード/デコード
DiT
が主な生成モジュールとして、クロスアテンションを用いてテキスト条件付けを行う
Kandinsky
ブランドそのものは画像生成AIモデルから連番になっている
動画生成モデル