Fuyu-8B
https://huggingface.co/adept/fuyu-8badept/fuyu-8b
https://www.adept.ai/blog/fuyu-8bFuyu-8B: A Multimodal Architecture for AI Agents
decoder-onlyのMLLM
https://gyazo.com/79253f370a3c020661842b0a3c8977ee
画像エンコーダを持たない
画像パッチは、embedding lookupをバイパスしてTransformerの最初のレイヤーに直接投影されます
ライセンス
CC-BY-NC
#Adept_AI