CogVLM2-Llama3-Caption
https://huggingface.co/THUDM/cogvlm2-llama3-caption
THUDM
/cogvlm2-llama3-caption
CogVideoX
のトレーニングプロセスでビデオデータをテキストに変換するために使用される
キャプション
モデル
CogVLM