StableRep
https://arxiv.org/abs/2306.00984StableRep: Synthetic Images from Text-to-Image Models Make Strong Visual Representation Learners
https://github.com/google-research/syn-rep-learngoogle-research/syn-rep-learn
https://gyazo.com/d22a989d02680fafef66f0ba0badd94f
Stable Diffusionで生成された複数の画像を互いに正例とするmulti-positive contrastive learning method
テキストと画像の対比学習も併用することで、言語的な教師情報を加えることができる。
ImageNetでCLIPの性能を超える
#Google