SynCLR
https://arxiv.org/abs/2312.17742
Learning Vision from Models Rivals Learning Vision from Data
合成画像にLLMによるキャプション付けを行い
CLIP
を学習する
逆かなこれ
nomadoor.icon
LLMでプロンプトを作って、そのプロンプトで画像生成
そのデータセットで
VLM
を作る
https://gyazo.com/765045837f11e7f0cba30e7b4e5dbb3b
関連
StableRep
合成画像で学習
Google