AnimeIllustDiffusion
https://gyazo.com/606a409acb76bb95776d6b921be7f08b
モデルの学習
300枚以上の人工的にトリミングされ、タグ付けされた512x512サイズのアニメイラスト画像をトレーニングセットとして使用し、dreamboothを使用してNaifu 7Gモデルの微調整を行うようにしています。学習セット画像1枚につき100エポック、高い学習率で学習させました。正則化された画像は使っていない。また、テキストエンコーダの訓練も行った。 モデルのマージ
Merge Block Weightedを使って3つのモデルを統合し、このAnimeIllustDiffusionモデルを作成しました。3つのモデルのうち、1つのモデルはスタイルとテキストエンコーダー(ベースアルファとすべてのOUTレイヤー)に、1つのモデルは手のディテールの最適化(INレイヤー00〜05)に、もう1つのモデル(Pretty 2.5D)はより良い構図の提供(INレイヤー06〜11とM00レイヤー)に使用されている。 badv3との併用、というか研究目的に作られたモデル? ワークフロー
ライセンス