UniReal: Universal Image Generation and Editing via Learning Real-world Dynamics
https://arxiv.org/abs/2412.07774
NotebookLM
既存のソリューションがタスクごとに異なるのに対し、UniRealは画像レベルのタスクを「不連続なビデオ生成」として再構築し、一貫性を保ちつつ視覚的な多様性を捉えるというビデオ生成モデルの原則を応用しています。
これにより、テキストからの画像生成、編集、カスタマイズ、合成など、多様な入出力構成をシームレスにサポートし、影や反射、オブジェクト間の相互作用などの現実世界のダイナミクスを学習して、非常にリアルな結果を生成できる汎用的な能力を発揮します。