Seed1.5-VL
https://gyazo.com/41d4052ea662e942d606713eeebd48d8
Seed1.5-VL は、532M パラメータのビジョンエンコーダと、20B のアクティブパラメータを持つ Mixture-of-Experts(MoE)型大規模言語モデルで構成されています。
GUI 操作やゲームプレイといったエージェント中心のタスクにおいては、OpenAI CUA や Claude 3.7 をはじめとする主要なマルチモーダルシステムを上回る性能を示しています。