GPT-4oの画像生成
やっとリリースされたのかこれ
GPT-4oが発表された時にデモ動画で明らかにDalle3ではできないことをやっていたのが2024年5月
待ちくたびれて、リリースしないのかと思っていた
DALL·E 3に代わって、ChatGPTの標準画像生成モデルとなった。
現行のGPT-4oは、よりリアルな画像と読みやすいテキストを生成可能
生活感のある画像や企業ロゴ、スライド資料も作成可能
画像内に複数行のテキストを自然に配置可能
透過背景の画像も出力可能(例:ロゴ用途)
改良には約100人の人間トレーナーによる「人間のフィードバックを用いた強化学習(RLHF)」を活用
手や顔の崩れ、誤字などを人間が指摘 → モデルが学習
これにより人間の指示への追従精度が向上
応用例
ユーザーがアップロードしたブランドガイドに従った画像生成
企業(例:GoDaddy)では、ストック画像やロゴ生成に活用中
限界もあり
例:窓が2つある部屋の写真を使って模様替えした画像を作成したところ、窓が1つしか再現されなかった
Shutterstockなどとの提携データや公開データを使用
https://gyazo.com/b5af93d5c0420ce1d674da4e0007ab63
うややや
フォントが学習されたのか、使われるようになったのが大きい
よく見るといつものやつだけど、商業出版物でなければ許容範囲
https://gyazo.com/1f712064f309dcf28dbbd2514ae7b36b
しかし文はネイティブが書いていない文章になっている
TruthSayerには「脳梗塞の人がかいた漫画」ともっぱらの評判
事情判決の法理
https://gyazo.com/b22a43747d389eb56129b938b692d682
code:txt
【イラスト構成案:司法の忖度を強調した風刺画】
■ 中央の裁判官(象徴的キャラ)
• 表情:冷や汗をかいており、天秤が傾いている
• 背後に国会議員の巨大な影(威圧的)
• 手に「違憲」と書かれた紙を持っているが、その下に「…でも無効にはしません」と書かれた紙を隠している
■ 吹き出し・セリフ
• 裁判官:「本当は違憲…だけど混乱を避けるために…(チラッ)」
• 国会議員(ニヤついている):「空気読んでくれて助かるよ〜」
• 有権者:「なんで違憲なのに有効なの!?ふざけてるの?」
■ 背景の構図
• 裁判所の建物の上に「法の番人」と書かれているが、その下に「※ただし空気読む」と小さく注釈
• 議事堂の方向に向かって深々と頭を下げているシルエットの裁判官
■ アイテム的メタファー
• 裁判官の天秤の片方に「憲法」、もう片方に「混乱回避」と「国会の都合」が山盛りに乗っていて、バランスが崩れている
• 裁判官の背中に「事情判決の法理」のハンコが押されている
かなり自由なレイアウトができるようになっている点はすごい
参照画像あり
https://gyazo.com/8bf4764753280a1ea7f81c49239dda39
基素.iconこのアイコンを、柔らかい彩色・繊細な線・透明感のある瞳・ふわっとした空気感、少ない線、少ない色使いでいて
GPT-4o.icon
このアイコンを以下のようにリファインしたい、ということですね:
柔らかい彩色
繊細な線
透明感のある瞳
ふわっとした空気感
少ない線
少ない色使い
確認ですが、以下の方向性で画像を変換してよろしいでしょうか?
現在のデザインをベースに、輪郭やディテールを簡略化して「ミニマル寄り」な雰囲気に。
水彩やパステル風の柔らかい色味に。
目は透明感が出るように、彩度はやや高めでグラデーションを重視。
背景もなるべくシンプルにして、全体的に余白と「抜け感」を出す。
OKであれば、この方針でイラスト化します。何か追加の希望(たとえば服や表情の変更など)があれば教えてください。
基素.iconOK
https://gyazo.com/f12585005267a751abb2b346a0e232e6
基素.iconあわすぎる
結局この後改善できなかった
あとシャツが普通のTシャツになっていった
AI画像生成は、AIが考える「普通のデザイン」になっていくが、自分がやりたいのはちょっと変なデザインなのでそのコントロールがまあ無理
基素.icon
https://gyazo.com/8bf4764753280a1ea7f81c49239dda39https://gyazo.com/937a0ba64443f6664fc553335f4cdda0
1枚目のアイコンを、柔らかい彩色・繊細な線・透明感のある瞳・ふわっとした空気感、少ない線、少ない色使いでいて
アニメ塗りのようなパキッとした色で良い。
2枚目は全体像の参考画像です
線はもっとはっきりさせてください。入り抜きで表現せずに、フラットな線です。スタバとかにいく人にウケそうなイラストを想像してください。線は線をあえてつなげないことでハイライトを表現してください。
瞳の中だけ水彩のような柔らかい色味にしてください
後ろ髪は短髪です。見えないようにしてください
前髪の「触覚」のような髪の毛は長いままでよいです
メガネはウェリントンとボストンの中間みたいな形です
https://gyazo.com/f5830a0512c4212d89104021491ab237
基素.icon
ツノが消えてしまっています
後ろ髪は小さなポニーテールなので、前から髪は見えません
https://gyazo.com/09f2c567587695563ebfb90bf65cb6ea
基素.iconツノが消えてしまっているので、ツノをつけてください
https://gyazo.com/690258f286ef133264d16e85792e7731
ツノの位置が気に食わないけど概ねいい感じになった
本当は耳がもっと長いんだけど...など細かいことをやろうとすると時間が伸びていくのでこれまで
基素.icon左目に泣きぼくろあります
https://gyazo.com/4b659afc68e326fdd2551a1d4d8bfc4e
そっち右目〜
https://gyazo.com/937a0ba64443f6664fc553335f4cdda0
基素.iconこのイラストを3Dモデル屋に発注できるような三面図にして
https://gyazo.com/c544414ce6b1d0d1974c9785659c3ad9
ツノは消される運命