Visual Autoregressive Modeling
= VAR
https://var.vision/Project
https://arxiv.org/abs/2404.02905Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction
https://huggingface.co/FoundationVision/varFoundationVision/var
https://gyazo.com/135645adc77fcba68787f4071bcf6059
VQGANのような標準的なautoregressive modeling(AR)が左から右、上から下へと順にトークンを生成するのに対し、VARは並行して生成する
text2image