StreamingT2V
https://streamingt2v.github.io/Project
https://arxiv.org/abs/2403.14773StreamingT2V: Consistent, Dynamic, and Extendable Long Video Generation from Text
https://github.com/Picsart-AI-Research/StreamingT2V/tree/StreamingModelscopePicsart-AI-Research/StreamingT2V
https://github.com/Picsart-AI-Research/StreamingT2VStreamingSVD
https://gyazo.com/0c97442a8af1b2a5c1bb84ff3994a03d
Stable Video DIffusionなどは16 or 24フレームしか作れない
最初の16フレームを短期記憶としてCAMに入れ、最後の16フレーム目を元にしてまた16フレーム作るという...のをN回繰り返して無限長の動画を作れるようにする
最後にrefinerで高画質にする