🦊制御画像の作成
👉 |
ControlNetが代表的ですが、画像生成AIではテキストプロンプトの他に、棒人間や深度マップのようなものを使い生成する画像を制御する技術があります
ここでは、この"制御画像"自体を作る手法(カスタムノード)をいくつか紹介します
ポーズ推定
人物画像からポーズを抽出します
https://gyazo.com/83198cb34273c367c639fccbaaf05c9d
OpenPoseの上位互換のような扱いをされることが多いですが、後ろ姿が苦手だったりするので使い分けが必要です
https://gyazo.com/ec5a9d16b5348957a08ff22d7358a647
https://gyazo.com/1bae6027b5896c0b1e9255e08ff348a2
深度推定
速度と精度のバランスが良いです
https://gyazo.com/b52c7ca6ce14df9e32c1793b51741ca4
Normal推定
https://gyazo.com/88791ea63c171bfc6edeb649a0fd6b9d
Edge検出
https://gyazo.com/cae29a00120ab15b36192ab941ca8dfa
https://gyazo.com/6bcf590e1bb7ea32eca37be36ec21230