Ovis
https://github.com/AIDC-AI/OvisAIDC-AI/Ovis
https://arxiv.org/abs/2405.20797Ovis: Structural Embedding Alignment for Multimodal Large Language Model
Ovis(Open VISion)は、新しいマルチモーダル大規模言語モデル(MLLM)のアーキテクチャであり、視覚とテキストの埋め込みを構造的に整合させるよう設計されています。
2025/1/26
Ovis2