SteadyDancer

https://gyazo.com/23c1d9285739317d981afdd4e8715a37

従来のHuman Motion Transferは、参照画像をポーズにどう追従させるかというreference2video的な設計をしている

SteadyDancerでは、1フレーム目をそのままに続きを生成するimage2videoを基本として、モーションの方を参照画像に合わせに行く設計をした

https://gyazo.com/2b4c7983d540113623709e3244802ab2

🔶Condition-Reconciliation Mechanism

Condition Fusion

一般的には参照画像とポーズ動画の潜在を同じものとして混ぜてしまうが、見た目と動きの情報がごちゃまぜになる

SteadyDancerではconcatに変更

🟩Synergistic Pose Modulation Modules

Pose Latentをそのまま使わず、参照画像と相性が良くなるように作り直す

SSAE（Spatial Structure Adaptive Extractor / Refiner）

参照キャラにあった骨格に修正

TMCM（Temporal Motion Coherence Module）

時間方向のガタツキを平滑化

自前のダンス動画・TikTokデータセットで学習

実写動画がほとんどのためアニメ画像ではうまくいかないかもしれない

ライセンス

シンプルで良さそうnomadoor.icon　

実装