GPT-5.2
https://openai.com/ja-JP/index/introducing-gpt-5-2/
GDPval⁠ において、GPT‑5.2 Thinking は新たな最高スコアを達成し、当社のモデルとして初めて人間の専門家レベルに達しました。
GDPval では、米国 GDP に大きく寄与する上位9産業の44職種を対象に、明確に定義された知識業務タスクに取り組むモデルの性能を評価します。タスクは、営業用プレゼンテーション、会計スプレッドシート、救急診療スケジュール、製造図面、短編動画など、実際の成果物の作成を求めます。
GDPval のタスクを業界専門家の11倍以上の速度、1%未満のコストで生成
https://gyazo.com/5a99976c22885ce7f9c0dc9edf3599ee
https://x.com/openai/status/2000975294694613200?s=46