Janus
https://gyazo.com/1b5b04679d1677d93356c78e08ffc82d
https://github.com/deepseek-ai/Janus
deepseek-ai/Janus
https://arxiv.org/abs/2410.13848
Janus: Decoupling Visual Encoding for Unified Multimodal Understanding and Generation
https://huggingface.co/deepseek-ai/Janus-1.3B
deepseek-ai/
Janus-1.3B
画像生成と画像理解の両方を行う
MLLM
ただし、エンコーダは生成用と理解用を分けている
関連
Chameleon
#DeepSeek_AI