CogVideoX-Fun
CogVideoX-FunはCogVideoXの構造をベースに改良されたパイプラインで、AI画像や動画の作成、Diffusion TransformerのベースラインモデルやLoraモデルの学習に使用できます。 既に学習済みのCogVideoX-Funモデルから直接予測をサポートし、異なる解像度で約6秒、8fps(1~49フレーム)の動画を生成することができます。 また、ユーザー自身がベースラインモデルやLoraモデルをトレーニングして、特定のスタイル変換を実現することもできます。 モデル
poseを3Dレンダリング動画に対して使った例