SANA
https://gyazo.com/2efd5bde167801f5b4f76a1bfe17f4de
https://nvlabs.github.io/Sana/Project
https://github.com/NVlabs/SanaNVlabs/Sana
https://arxiv.org/abs/2410.10629SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers
https://gyazo.com/d3318d5823ff71287bbdb5c63bfb7a1e
AE-F32
通常のオートエンコーダでは8倍のところ、32倍に圧縮する
Efficient Linear DiT
テキストエンコーダをGemmaに
model
Sana-0.6B
Sana-1.6B
関連
DC-AE
画像生成の高速化
#Nvidia
https://x.com/gradio/status/1878679402676146203?s=46&t=aBgVHjAMy0TFw0zYAE90WQApache 2.0
なのはコードだけで重みはhttps://huggingface.co/Efficient-Large-Model/Sana_1600M_1024px_MultiLing/blob/main/LICENSE.txtNSCL v2-custom