画像生成AIを扱うルーン
https://pbs.twimg.com/media/FRtXzyaUUAAgsyH.jpghttps://pbs.twimg.com/media/FRtXz7zUUAAUFxa.jpghttps://pbs.twimg.com/media/FRtX0GrVgAA5-QN.jpghttps://pbs.twimg.com/media/FRtX0UYUUAEHNkp.jpg
呪文を唱えると生成の方向性を決める
一つの言葉は複数の意味を持つので複数のテイストの画像が生成される
「赤いりんご」を出したいとき
I love Apple (fruit)だと青リンゴとアカりんご両方出る
「イーコマースサイト用の、画質の良い、シンプルな背景にある、単独の赤いりんご」で望んだ絵が出る
good quality photography of a singular red apple on simple background for e-commerce site --stop 75
「イーコマース用商品写真」は背景やレイアウトの再現性が高い。ここに気づけば、よい呪文プロンプトを練れる。
色彩が、「赤と青と緑が混ざったような状態」のときは、ベクトルが曖昧すぎる状態と思われる。それはMidJourneyの画風ではない。もっとベクトルの限定が必要な状態。
「学習の中で内容がブレずに何度もでてくる画像と文字のペア」には、強い力が生まれる。
AIの学習はネットにある画像と解説文で学習させているので
"Unreal Engine"や"Playstation5"というルーンを置くと、画質が向上しやすい。
これはAIが、記事と画像のペアから「アンリアルエンジン(ゲーム作成ツール名)は、画質がすごい」といった内容を学んでいるからだろう。
"beautiful concept art of" を付与するのも強い。
「平均的なコンセプトアートと呼ばれる画像は、絵が上手い」からだ。
詠唱の末節に、「Canon EOS 5D Mark 4と、SIGMA Art Lens 35mm F1.4 DG HSMレンズで撮影、F値2.4、ISO 200、シャッタースピード2000」など追加すると、品質が大きく高まる。
画質だけでなく、構図やライティング、ボケなどを含めて全体的にコントロールできる。
「そのような表記がついている画像は、プロの写真や、メーカー公式のサンプル写真、ハイアマチュアがとった写真サイトの作品」とAIが学んでいるためだ。
ワードの順番も大事
主題が変わる
原則としては、おおまか「手前にある文ほど強く、後ろにある単語ほど弱い」「最後の文はそこそこ強い」「前置詞や関係代名詞の前の単語のほうが強くでて、後ろの単語のほうが弱くなる」というような特徴を、やんわりと持つ。
基本的には、「美術館や、写真サイト、画集のキャプションに近い文体」で、呪文プロンプトを作るのがよい。
<全体のフォーマット><主題><主題の補足><作者><全体の補足><フレーバー>
<全体フォーマット>Detailing oil painting of
<主題>The great white castle on deep forest landscape
<英霊>by CASPAR DAVID FRIEDRICH and CLAUDE LORRAIN,
AI魔術の詠唱には、第二音節〜第三音節に古き偉大なるものの御名を入れると、精度が安定する。ダヴィンチとかレンブラントのようなトップ英霊か、カラヴァッジオのような、いまだ忘れ去られぬ古きものの名だ。
英霊や精霊には地域・知名度補正がかかる。日本の英霊の御名を唱えても、西洋の魔術基盤アメリカのAIの下では制御しにくい。知名度補正的にはHokusai級の大英霊でないと、なかなか安定しない。
同種の属性をもつ英霊をミックスすれば、表現が安定する。逆に異なる属性を持つ英霊をミックスすれば、不安定化するが表現がブレンドされる。
<全体の補足> perfect lighting, golden hour,
<フレーバー> taken with Canon 5D Mk4
英霊はAIの思った英霊であること注意
AIが学習したのは、「ダヴィンチという単語と紐づいた画像群」にすぎない。そこにはダヴィンチの弟子や、ダヴィンチの影響を受けた作品、ダヴィンチの実家、ダヴィンチと比較された作品の成分も混ざっている為だ。
画像と文字を比較可能なベクトルに変換し、これらの距離を最小化する画像を生成する
ユーザーから文字列を受け取り、それにペアになる画像を生成
欲しい画像を出すには、「自分の欲しい画像が、美術館サイトやECサイト、写真サイトにあるとき、どのようなキャプションが付いてそうか?」を想像して、それにあう文章を考えればいい
重みを直接指定可能