追加学習ってなんぞや
モデルを売る(これは大丈夫だよね?)というマネタイズが主流になる可能性もあるし絵の幅が出ると思うので知りたい
学ぶ前の終着点(と思うもの)
いくつか好きな絵柄に特化させたモデルを持つ
いい絵(基準わからんけど)を出せる汎用的なモデルを持つ
Dreambooth調べてたらすんごい詳しいのがあった
追加学習というのは大まかに説明すると、誰かほかの人が学習させた学習済みモデルに対して自分好みに変更したり、学習させたりするという手法
転移学習 (Transfer Learning)
蒸留 (Distilation)
ファインチューニング (fine tuning)
その他の学習法
Dreemboothはここ
一般的なディープラーニングの知識
まじで説明がない、wogikaze.icon
2010年の説明では意味が広くて曖昧な言葉と言われている基素.icon
一般的なディープラーニングの知識
すでにあるモデルを使って学習する?
こちらも情報がなく困る
他のモデルで生成した画像を使ってファインチューニングするのもこちらに入る?
漸進的蒸留
スマホやIot機器でAIを動かしたくても、モデルはサイズが巨大過ぎて扱えない
e.g. GPT-3は45TBある
ので、様々な方法で圧縮する
ファインチューニング
追加学習したいデータを大量に持っていてるときにファインチューニングを使うと過学習を起こしにくくい
でtextual inversionとhypernetwork、DreamBoothみたいな調節してるやつがファインチューニング
https://gyazo.com/34786ae93d38ddb691e0b949ec748b41
・DreamBoothは少数の画像から新しい概念をタグとして学ばせる事が可能
・textual inversionと同等だが全体を最適化するためにより強力でメモリ喰い
・DreamBoothの省メモリ実装は推論だけなら6GB程度のメモリで動作可能
タグに結びつける感じかなwogikaze.icon
textual inversionも同じことやってるの?
textual inversionは画像からstable diffusionに新しい概念を学ばせる手法
なるほど、同じだ
モデルが公開されていたらできるってことかな
いやこれがそもそもDreamboothされたモデルだ、ならできそう
Textual inversionとHypernetwork,DreamBoothの違いがよくわからない
Textual Inversion Hypernetwork
覚えさせたいタグ Initialization Text に入れる タグファイルに書く
覚えさせたくないタグ タグファイルに書く タグファイルに書く
使用法 embedding 名をプロンプトに入れる キャラ/オブジェクトに関係のあるタグをプロンプトに入れる
Textual Inversion も Hypernetwork も Aesthetic Gradients もデフォルトの状態で出せないような絵は出力できない。
画像生成AIのStable Diffusionに数枚の画像を学習させ、AIモデル全体を再学習させて調整(ファインチューニング)を行う手法
無限ループものかw?wogikaze.icon
ここも後に引用されるのであった…nomadoor.icon
指定したワードで背景も変えられる
画風ファイルを追加することで、元のモデルにはない画風や概念・キャラの特徴などを追加することができる。
データセットを集める
マージする
結局やってみなくちゃわからない、ということで
TI: 入力されたプロンプトを一定の方向に曲げる、みたいなイメージ。新しいものを覚えられているようで言葉の方向性を捻じ曲げてるだけだから覚えていない
DB: AIの中の言語を処理する部分と画像を処理する部分に同時に新しい要素を覚えさせる、新しいものを覚えられるがckptファイルごとになるので色んなとこで重い
LoRA: DBから学習させた要素だけ別ファイルになってる感じ、かるいしDBと同じ動作ができる
韓国 HN,DBが強い
中国 TIが強い
日本 層別が強い
Aesthetic Gradients:
生成物の雰囲気をモデルが知ってる範囲で新しい特定概念に寄せる (画風向け / コスパ重視)
メリット: 計算量少ない
Textual Inversion:
生成物をモデルが知ってる範囲で新しい特定概念に寄せる ( キャラまたは画風向け )
メリット: プロンプトに入れるので 組み合わせしやすい + 新しい単語を覚えさせられる (VRAM 8GB)
Hypernetwork:
モデルそのものを変えずに 新しい特定概念に寄せる ( 画風向け / コスパ重視)
メリット: プロンプトに入れず反映される(キーワードに含まれる) (VRAM 8GB)
Dream Artist または Advance Prompt Tuning ( キャラ向け )
モデルそのものを変えて 新しい概念に寄せる (画像1枚版)
メリット: 学習させる画像枚数が少ない
Dream booth ( キャラ向け )
モデルそのものを変えて 新しい概念に寄せる
メリット: 再現度・成功率・安定感が高い