Fuyu-8B
https://huggingface.co/adept/fuyu-8b
adept/fuyu-8b
https://www.adept.ai/blog/fuyu-8b
Fuyu-8B: A Multimodal Architecture for AI Agents
decoder-only
の
MLLM
https://gyazo.com/79253f370a3c020661842b0a3c8977ee
画像エンコーダを持たない
画像パッチは、embedding lookupをバイパスして
Transformer
の最初のレイヤーに直接投影されます
ライセンス
CC-BY-NC
#Adept_AI