Visual Autoregressive Modeling
=
VAR
https://var.vision/
Project
https://arxiv.org/abs/2404.02905
Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction
https://huggingface.co/FoundationVision/var
FoundationVision
/var
https://gyazo.com/135645adc77fcba68787f4071bcf6059
VQGAN
のような標準的な
autoregressive modeling
(AR)が左から右、上から下へと順にトークンを生成するのに対し、VARは並行して生成する
text2image