SynCLR
https://arxiv.org/abs/2312.17742Learning Vision from Models Rivals Learning Vision from Data
合成画像にLLMによるキャプション付けを行いCLIPを学習する
逆かなこれnomadoor.icon
LLMでプロンプトを作って、そのプロンプトで画像生成
そのデータセットでVLMを作る
https://gyazo.com/765045837f11e7f0cba30e7b4e5dbb3b
関連
StableRep
合成画像で学習
Google