SteadyDancer
https://gyazo.com/23c1d9285739317d981afdd4e8715a37
SteadyDancerでは、1フレーム目をそのままに続きを生成するimage2videoを基本として、モーションの方を参照画像に合わせに行く設計をした
https://gyazo.com/2b4c7983d540113623709e3244802ab2
🔶Condition-Reconciliation Mechanism
Condition Fusion
一般的には参照画像とポーズ動画の潜在を同じものとして混ぜてしまうが、見た目と動きの情報がごちゃまぜになる
SteadyDancerではconcatに変更
🟩Synergistic Pose Modulation Modules
Pose Latentをそのまま使わず、参照画像と相性が良くなるように作り直す
SSAE(Spatial Structure Adaptive Extractor / Refiner)
参照キャラにあった骨格に修正
TMCM(Temporal Motion Coherence Module)
時間方向のガタツキを平滑化
自前のダンス動画・TikTokデータセットで学習
実写動画がほとんどのためアニメ画像ではうまくいかないかもしれない
ライセンス
シンプルで良さそうnomadoor.icon
実装
関連