JoyTag
CLIP等主要な視覚モデルは健全とみなされた画像のみで学習されているため表現の幅が狭まってしまっている より包括的でNSFWなものにも対応できるものを目指し作成された
少なくともStable Diffusion界隈ではWD14-taggerはこれに置き換えられていきそうnomadoor.icon https://gyazo.com/d36ff7633d15e402e1606d0219e35dac
リアル系の強さは言わずもがな、この画像からスバルさん読み取れるのかnomadoor.icon
とても強い
関連