Vision Language Model
#VLM
画像とテキストを同時に解析できるマルチモーダルモデル