OFT
https://arxiv.org/abs/2306.07280Controlling Text-to-Image Diffusion by Orthogonal Finetuning
https://github.com/tripplyons/ofttripplyons/oft
OFTは、下流のタスクに適応しながら、テキストから画像への拡散モデルの超球面エネルギーを保存することで、事前学習された生成能力を損なわずに、より強力な制御性を得ることを目指します。
OFTは、各層のニューロンに対して層共有の直交変換を学習することで、ニューロン間の角度を保存します。OFTは、直交変換を効率的にパラメータ化するために、ブロック対角構造やCayley変換を用いる工夫を行います。
🤔nomadoor.icon
https://gyazo.com/5e76157ad0b28c2ce1a448838370c538
DreamBooth/LoRA比較して過学習に強く収束速度も早い
ControlNet/T2I-Adapterと比較してIoUやF1スコアで優れている
少ないデータでファインチューニングできる
画像のコントロール