GPT-4o image generation
https://scrapbox.io/files/67ee9de9e4126721f9de7d87.png
2025年3月に発表された、新しい画像生成。
非常に高性能の画像が作れるようになった。
詳細なプロンプトに従い、最大10-20個のオブジェクトを処理できる
特に、従来の画像生成AIが苦手としていたことが、改善されるように
日本語文字出力が、可能になった
手の出力が、かなり上手になった
一貫したイメージを、出力できるようになった
2つの画像を、合成できるようになった
アップロードした画像をもとに、画像生成できるようになった
制限事項
ポスターなど、縦長の画像の場合、特に下が切り取られる
プロンプトの内容が乏しいと、幻覚で、変な画像が作られる
10-20を超えるオブジェクトを、一度に正確に生成するのは難しい
多言語のテキスト出力
画像編集の精度
System Card
Creating images in ChatGPT
人工分析画像アリーナでELOスコアで同率1位となり、Recraft V3、FLUX 1.1 pro、Gemini 2.0 Flashを上回った。