🦊制御画像の作成

👉 |

ControlNetが代表的ですが、画像生成AIではテキストプロンプトの他に、棒人間や深度マップのようなものを使い生成する画像を制御する技術があります

特に正式名称はありませんが、この"棒人間"や"深度マップ"といったものは制御画像(control image)と呼ばれ、指定したポーズや形の画像を生成することができます

ここでは、この"制御画像"自体を作る手法(カスタムノード)をいくつか紹介します

ポーズ推定

人物画像からポーズを抽出します

https://gyazo.com/83198cb34273c367c639fccbaaf05c9d

OpenPoseの上位互換のような扱いをされることが多いですが、後ろ姿が苦手だったりするので使い分けが必要です

https://gyazo.com/ec5a9d16b5348957a08ff22d7358a647

https://gyazo.com/1bae6027b5896c0b1e9255e08ff348a2

深度推定

速度と精度のバランスが良いです

https://gyazo.com/b52c7ca6ce14df9e32c1793b51741ca4

Normal推定

https://gyazo.com/88791ea63c171bfc6edeb649a0fd6b9d

Edge検出

https://gyazo.com/cae29a00120ab15b36192ab941ca8dfa

https://gyazo.com/6bcf590e1bb7ea32eca37be36ec21230