nomadoorのLoRA学習メモ

onetrainer doc

ツール

画像をあいまいに検索して重複画像を探す

データセットについて

共通

低画質画像は使うな

charの場合はそのキャラ意外は映らないようにする

Charなら50枚以上・Styleなら100枚以上

主にStyleLoRA

学習画像を適切なサイズにリサイズするbucketing機能がsd-scriptなどのソフトにはついているが、使わずに自分で整えたほうが良い結果が得られやすい

https://gyazo.com/1f147895b229972d2c38b96426b8f3c8

一枚の絵から白背景で埋めたもの、上半身クロップ、顔クロップの3枚が作れる

アニメ系アップスケーラーのオススメはReal-ESRGAN-anime

微妙な画像はimage2imageでガンガン修正していけ

NSFW系のモザイクなどの修正もLoRAには邪魔なのでimage2imageする

キャラクターLoRA

タグの剪定は大体LoRA学習でのタグ付けTipsに書いてあることと同じ

ただしwd14taggerのタグ全残しもあり

プロンプトに服とか髪の色とかを書かないといけないけれど、その分自由度がある

タグ全残しから、適度に剪定するというのはグラデーションで2択ではないかも

キャラクターパック

複数のchar/concept LoRAを一つのLoRAにまとめる

と、それらを組み合わせた絵を作れるが正直難しい

これはLoRAというよりStable Diffusionの性能不足

コンセプトLoRA

半分運ゲー

そういえばRelation Inversionというものがあったけどどこにいったんだろうかnomadoor.icon

データセットのフォルダ分け

https://gyazo.com/1cbf6480a560cc2fc3e17b07cd72be15

もし複数の服装を使い分けられるLoRAが作りたい場合はフォルダを分ける

十分な量が用意できない服装の画像や、上半身しか写っていない画像はMiscフォルダにまとめる

フォルダ名XX_Sailor...のXXは繰り返し回数

画像が少ない場合はこれを大きくして(逆は小さく)して全体のバランスを取る

こんなことできたのかnomadoor.icon

https://scrapbox.io/files/65ca45351072980024bc3046.webp

モデルの評価

https://civitai.com/articles/1536/ghostreviewaickptby-ghostmix-creatorGhostReview: 世界初のAIペイントckptレビューフレームワークコードツール (By GhostMix Creator)

StyleLossを用いたckpt/LoRAモデルの評価

それに対する反論

https://civitai.com/articles/2848/style-lossstable-diffusionloraスタイル・ロスは、安定拡散モデルとLoRAモデルの互換性を評価する指標として使用できるか？