GPT-4o image generation
https://scrapbox.io/files/67ee9de9e4126721f9de7d87.png
2025年3月に発表された、新しい画像生成。
https://openai.com/index/introducing-4o-image-generation/
非常に高性能の画像が作れるようになった。
詳細なプロンプトに従い、最大10-20個のオブジェクトを処理できる
GPT-4o Image Generationでできること
特に、従来の画像生成AIが苦手としていたことが、改善されるように
日本語文字出力が、可能になった
手の出力が、かなり上手になった
一貫したイメージを、出力できるようになった
2つの画像を、合成できるようになった
アップロードした画像をもとに、画像生成できるようになった
制限事項
ポスターなど、縦長の画像の場合、特に下が切り取られる
プロンプトの内容が乏しいと、幻覚で、変な画像が作られる
10-20を超えるオブジェクトを、一度に正確に生成するのは難しい
多言語のテキスト出力
画像編集の精度
System Card
Addendum to GPT-4o System Card: Native image generation
Creating images in ChatGPT
https://help.openai.com/en/articles/8932459-creating-images-in-chatgpt
人工分析画像アリーナでELOスコアで同率1位となり、Recraft V3、FLUX 1.1 pro、Gemini 2.0 Flashを上回った。
https://x.com/ArtificialAnlys/status/1906713712381337732