dataset-tag-editorで画像にキャプションを付ける
概要
dataset-tag-editorのstand-alone版の使用方法を記録する
本ツールはkohya's GUIでLoRAファイルを作成するためのデータセットの作成に使用する
専用のWeb UIで簡単に操作できる
設定→編集→生成の流れ
はじめに:画像をまとめるフォルダを作成
「Dataset directory」にパスをコピーする
あまり大量の画像を扱うことはできない(筆者は1,000枚の画像を試したが、バグった)
起動方法
./dataset-tag-editor-standalone/scriptsに移動
python launch.pyを実行後、指定のIPにアクセス
キャプションの生成設定
「Use Interrrogator Caption」の「Overwrite」にチェック
「Interrogator」は「wd-v1-4-vit-tagger-v2」を選択
ここまでできたら「Load」ボタンを押す
右下にキャプション、左下に読み込んだ画像が出てくる
キャプションの編集
キャプションの厳選
重要:学習させたい特徴を表すキャプションを削除する
画面右の「Batch Edit Captions」の「Remove」タブに切り替える
学習させたい特徴を表すキャプションにチェックを付けていく
ここでチェックをつける作業を高速でおこなうとツールがバグります
「Remove selected tags」を押す
トリガープロンプトの挿入
LoRAを呼び出すための呪文みたいなもの
「Search and Replace」タブに切り替える
「Edit Tags」にトリガープロンプトを書く
Prepend additional tagsにチェックを入れる
「Apply Changes to Filltered Images」を押す
キャプションファイルの生成
画面右上の「Backup ...」のチェックを外す
「Save all changes」を押す
画像ファイルが入ったフォルダ内にキャプションファイルが.txt形式で出力される
経験済みのバグとその対処法
 キャプションの編集中に、選択していないキャプションが勝手に消えてしまいます
原因:起動した段階でツールがおかしくなっています
対処法:一度ツールを再起動する
 このツールを使った後、Stable DIffusionが動かなくなりました
原因:何かのライブラリのバージョン違いにより、依存関係がおかしくなっています
対処法:Stable Diffusionは入れなおしです. dataset-tag-editorを使うときは仮想環境でバージョンを分けましょう
#Yuma_Oe