(Archive)🦊image2prompt
from 🦊image2prompt
https://github.com/gokayfem/ComfyUI_VLM_nodesComfyUI VLM nodes
moondream1
https://gyazo.com/98e9db7b30f798307dc41fb9885ccb3b
moondream1.json
モバイルデバイスで使うことを想定した超軽量なVLMです
llava-v1.6-mistral-7b
https://gyazo.com/1d86d574200fa38c0199ef204c1dc688
llava-v1.6-mistral-7b.json
性能だけ見ればもっと良いものもありますが、画像生成と組み合わせることを考えたときの処理の軽さと性能のバランスはピカイチです
😚Joytag
WD14-taggerの強さを持ちつつ、汎用性を持たせた視覚モデルです
🪢カスタムノード
https://github.com/gokayfem/ComfyUI_VLM_nodesComfyUI VLM nodes
https://gyazo.com/d36ff7633d15e402e1606d0219e35dac
とてもおすすめnomadoor.icon
JoyCaption
🪢カスタムノード
https://github.com/aidenli/ComfyUI_NYJYComfyUI_NYJY
MLLM
GPT-4V
https://github.com/M1kep/ComfyUI-KepOpenAIM1kep/ComfyUI-KepOpenAI
Gemini
https://github.com/ZHO-ZHO-ZHO/ComfyUI-GeminiZHO-ZHO-ZHO/ComfyUI-Gemini
moondream2 (ローカル)
Comfyui image2prompt / ComfyUI VLM nodes
InternLM-XComposer2-VL (ローカル)
Comfyui image2prompt
BakLLaVA/LLaVA-1.6 /llava-v1.6-mistral-7b etc. (ローカル)
ComfyUI VLM nodes
deepseek-vl-1.3b-chat/deepseek-vl-7b-chat (ローカル)
Comfyui image2prompt
#Archive_page