SANA
https://gyazo.com/2efd5bde167801f5b4f76a1bfe17f4de
https://nvlabs.github.io/Sana/
Project
https://github.com/NVlabs/Sana
NVlabs/Sana
https://arxiv.org/abs/2410.10629
SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers
https://gyazo.com/d3318d5823ff71287bbdb5c63bfb7a1e
AE-F32
通常のオートエンコーダでは8倍のところ、32倍に圧縮する
Efficient Linear DiT
テキストエンコーダを
Gemma
に
model
Sana-0.6B
Sana-1.6B
関連
DC-AE
画像生成の高速化
#Nvidia
https://x.com/gradio/status/1878679402676146203?s=46&t=aBgVHjAMy0TFw0zYAE90WQ
Apache 2.0
なのはコードだけで重みは
https://huggingface.co/Efficient-Large-Model/Sana_1600M_1024px_MultiLing/blob/main/LICENSE.txt
NSCL v2-custom