HDM-xut-340M-anime
HDM (Home made Diffusion Model) は、顧客レベルのハードウェアまたは十分に安価な中古サーバー ハードウェアで実行可能なトレーニング セットアップを必要とする、「自宅での T2I モデルの事前トレーニング」用の特殊なトレーニング レシピ/スキームを調査するプロジェクトです。 この制約の下、マルチモーダル(例えば、テキストから画像への変換)生成モデル向けに設計された新しいTransformerバックボーン「XUT」(Cross-U-Transformer)を導入します。TREAD技術を用いた最小限のアーキテクチャ設計により、最大650米ドルの計算コストで実用的なパフォーマンスを実現できます。(vast.aiの価格に基づく) 2025/08/22 現在のドル相場(148.5円)で約9.6万円で学習されたらしい…
1GB以下という軽さ(SD1.5が4.2GB)で画像を生成できる
アニメ風のみ
プロンプトと画像サイズを形式に合わせないとすぐ崩れる
1536x1024で消費VRAM4GB程度
HDM Cameraという直感的なカメラ操作がついている
説明は論文にしかない