JoyTag
https://github.com/fpgaminer/joytagfpgaminer/joytag
https://www.reddit.com/r/MachineLearning/comments/18nb15l/p_i_built_an_open_sota_image_tagging_model_to_do/[P] CLIPではできないことをするために、オープンなSotA画像タグ付けモデルを構築した
タグ付けのための視覚モデル
CLIP等主要な視覚モデルは健全とみなされた画像のみで学習されているため表現の幅が狭まってしまっている
より包括的でNSFWなものにも対応できるものを目指し作成された
少なくともStable Diffusion界隈ではWD14-taggerはこれに置き換えられていきそうnomadoor.icon
ComfyUI VLM nodesで使う
https://gyazo.com/d36ff7633d15e402e1606d0219e35dac
リアル系の強さは言わずもがな、この画像からスバルさん読み取れるのかnomadoor.icon
とても強い
関連
WD14-tagger