Ovis
https://github.com/AIDC-AI/Ovis
AIDC-AI/Ovis
https://arxiv.org/abs/2405.20797
Ovis: Structural Embedding Alignment for Multimodal Large Language Model
Ovis(Open VISion)は、新しいマルチモーダル大規模言語モデル(
MLLM
)のアーキテクチャであり、視覚とテキストの埋め込みを構造的に整合させるよう設計されています。
2025/1/26
Ovis2