ACE++
テキスト/参照画像特徴/マスク/潜在ノイズ
これをチャンネル次元で結合することで計算コストを下げた
LoRA版
フルファインチューニング版
🚨
ACE++に関する問題への対応や更新が遅れてしまいましたことを、心よりお詫び申し上げます。FLUXモデルを用いた後学習によるACEモデルのさらなる開発を一時停止せざるを得ない状況となりました。FLUX基盤モデルを使用した後学習には、いくつかの重要な課題が判明しています。
主な問題点は、トレーニングデータセットとFLUXモデル間の高い非均質性であり、これによりトレーニングが非常に不安定になることです。さらに、FLUX-Devは蒸留モデルであり、その元々のネガティブプロンプトが最終的なパフォーマンスに与える影響が不確定である点も懸念されています。
text2imageでもVACE(WAN2.1)を使ったほうがいい可能性もあるのかnomadoor.icon
関連
開発元見るにこれも同じ技術かな?morisoba65536.icon