GPT-5
https://gyazo.com/15e4e3167e57c289021e56a204d4505b
https://gyazo.com/2ecefd1ec388ebf6e2030dff5e2e2229
GPT-5: 汎用的なタスクに対応
GPT5-mini: 速度とコストを重視
GPT-5-nano: 大量処理向けの単純タスクに最適
GPT-5-Pro: ChatGPT-5のProユーザー向け
APIでならそのうち使わせてもらえるかな?
Proシリーズは使えるアカウントだし
ハルシネーションの大幅な低減
Web検索を伴う応答では、GPT-4oと比較して事実誤認が約45%減少。
Thinkingモードでは、OpenAI o3と比較して事実誤認が約80%減少。
実行不可能なタスクや前提条件が不足している場合には、正直に「できない」と回答する能力が向上。
指示遵守能力の向上
過度な迎合表現の規制
長文コンテキストの処理能力
リアルタイムルーター機能
タスクの種類や複雑さに応じてThinkingモードを自動で切り替える。
コーディングと数学分野での進化
API100万トークン無料対象に含まれていたので使い倒せる。
https://gyazo.com/c1a156018df83214cfacbdebc61e1516
ややこしいモデル名が整理された
https://gyazo.com/fa2792e5a0ac9009950de05da639fdb0
色々とポンコツ扱いされている。
GPT-4oも長く提供されている間にどんどんアップデートされていったので、最終的にどうなるのかを見守る感じになるかな。
今のところ大きく困ったことは起きていない。
淡泊な傾向がある
プロンプトの追従性とハルシネーション低下をメインにしている印象。
EQが今後の課題なので、GPT-6もしくはGPT-5.5があるなら、GPT-4oやGPT-4.5系のパワーアップの可能性が高い。
指示出しで覚えておきたいポイント
指示の矛盾を排除し、優先順位を明示する
矛盾や曖昧さはGPT-5ほど厳密なモデルでは性能劣化の原因になる。
禁止・許可・例外の優先順位(どれが勝つか)をはっきりさせ、相反する条項をなくすこと。
例:緊急時はAを最優先、通常時はB、同意が未確認ならC…という階層を明示。
タスク分割とターン設計
複雑作業は「分離可能な小課題×複数ターン」に割るとピーク性能が出やすい。
各ターンで目的・入力・検証を閉じる。
“自己採点→再試行”のメタ枠組み
一発生成(zero-to-one)では、内部用の採点基準(5–7観点)を先に考えさせ、その基準で内部反省→作り直しを促すと質が上がりやすい。
“過探索”を抑えるトーン調整
旧モデル向けの「徹底的に調査せよ」は、GPT-5では検索多用の無駄を招く場合あり。
必要時のみ深掘りする言い回しに弱める。