VBVR
https://youtu.be/isnyV_BDgBE
ビデオ推論(Video reasoning)は、テキストが自然に捉えきれない空間時間的に一貫した視覚環境に知能を根付かせ、連続性、相互作用、因果律などの時空構造を超えた直感的推論を可能にします。しかし、ビデオ推論とそのスケーリング挙動を体系的に研究することは、大規模なビデオ推論トレーニングデータの不足により妨げられています。このギャップを埋めるために、私たちは「Very Big Video Reasoning(VBVR)データセット」を導入します。 model