RefVNLI
https://arxiv.org/abs/2504.17502
RefVNLI: Towards Scalable Evaluation of Subject-driven Text-to-image Generation
https://gyazo.com/4a890c3caa833dac635f47e0cf54d385
Subject-Driven Image Generation
タスクの評価手法
プロンプト整合性と対象維持の2つを見る
ベンチマーク