WD14-tagger
https://huggingface.co/SmilingWolf/wd-v1-4-moat-tagger-v2SmilingWolf/wd-v1-4-moat-tagger-v2
moat
https://huggingface.co/SmilingWolf/wd-convnext-tagger-v3SmilingWolf/wd-convnext-tagger-v3
https://huggingface.co/SmilingWolf/wd-swinv2-tagger-v3SmilingWolf/wd-swinv2-tagger-v3
https://huggingface.co/SmilingWolf/wd-vit-tagger-v3SmilingWolf/wd-vit-tagger-v3
https://huggingface.co/SmilingWolf/wd-v1-4-vit-tagger
説明がない基素.icon基素.icon
https://note.com/gcem156/n/nc03a1fb0ee4b
画像からdanbooruのタグを予測する
アストルフォの画像を渡して1girlとか出てくるのを見て馬鹿にしてやろうとおもって試したのですが、1boyとかotoko_no_koと返してきてびっくり仰天しました。
https://note.com/gcem156/n/ne334e7be9eb7
WD14-Taggerの登場により、danbooru由来のデータであろうがなかろうが、danbooruタグに基づく学習ができるようになりました
使う
Tagger for Automatic1111’s Web UI
ComfyUI WD 1.4 Tagger
基素.icon
出自不明
baiduで検索したら利用例だけ出てきた
https://blog.csdn.net/qq_56591814/article/details/128385416
https://github.com/toriato/stable-diffusion-webui-wd14-tagger/blob/master/docs/what-is-wd14-tagger.md
Image to text model created and maintained by MrSmilingWolf, which was used to train Waifu Diffusion.
deepbooruとの違いは?
https://github.com/kohya-ss/sd-scripts/blob/main/fine_tune_README_ja.md
WD14Taggerのほうが精度が良いようです
キャプション