Sora
diffusion Transformerと言う新単語?が出てる基素.icon
diffusion modelであり、transformerをつかってスケーリングしている
まともに読んでないですが、この論文から来てるのかな?nomadoor.icon
映像を学習しまくった結果世界モデル(物理シミュレータ)風に動くようになった、とあるwogikaze.icon
最近LLMをどうコンパクトに動かすかの研究が多かったけど、創発は結局のところ数で殴ることでしか起きないのかなnomadoor.icon
Open AI introducing Sora
text-to-video model
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions.
https://video.twimg.com/ext_tw_video/1758190624732512256/pu/vid/avc1/1280x720/UkX1I85YBuFLY26w.mp4?tag=12#.mp4