GPT-5 - ミルヨムカク

GPT-5

https://gyazo.com/15e4e3167e57c289021e56a204d4505b

#2025-08-08 : リリース

https://gyazo.com/2ecefd1ec388ebf6e2030dff5e2e2229

GPT-5: 汎用的なタスクに対応

GPT5-mini: 速度とコストを重視

GPT-5-nano: 大量処理向けの単純タスクに最適

GPT-5-Pro: ChatGPT-5のProユーザー向け

APIでならそのうち使わせてもらえるかな？

Proシリーズは使えるアカウントだし

ハルシネーションの大幅な低減

Web検索を伴う応答では、GPT-4oと比較して事実誤認が約45%減少。

Thinkingモードでは、OpenAI o3と比較して事実誤認が約80%減少。

実行不可能なタスクや前提条件が不足している場合には、正直に「できない」と回答する能力が向上。

指示遵守能力の向上

過度な迎合表現の規制

長文コンテキストの処理能力

リアルタイムルーター機能

タスクの種類や複雑さに応じてThinkingモードを自動で切り替える。

コーディングと数学分野での進化

API100万トークン無料対象に含まれていたので使い倒せる。

https://gyazo.com/c1a156018df83214cfacbdebc61e1516

ややこしいモデル名が整理された

https://gyazo.com/fa2792e5a0ac9009950de05da639fdb0

色々とポンコツ扱いされている。

GPT-4oも長く提供されている間にどんどんアップデートされていったので、最終的にどうなるのかを見守る感じになるかな。

今のところ大きく困ったことは起きていない。

淡泊な傾向がある

GPT-4.1やo3の系譜

プロンプトの追従性とハルシネーション低下をメインにしている印象。

EQが今後の課題なので、GPT-6もしくはGPT-5.5があるなら、GPT-4oやGPT-4.5系のパワーアップの可能性が高い。

指示出しで覚えておきたいポイント

指示の矛盾を排除し、優先順位を明示する

矛盾や曖昧さはGPT-5ほど厳密なモデルでは性能劣化の原因になる。

禁止・許可・例外の優先順位（どれが勝つか）をはっきりさせ、相反する条項をなくすこと。

例：緊急時はAを最優先、通常時はB、同意が未確認ならC…という階層を明示。

タスク分割とターン設計

複雑作業は「分離可能な小課題×複数ターン」に割るとピーク性能が出やすい。

各ターンで目的・入力・検証を閉じる。

“自己採点→再試行”のメタ枠組み

一発生成（zero-to-one）では、内部用の採点基準（5–7観点）を先に考えさせ、その基準で内部反省→作り直しを促すと質が上がりやすい。

“過探索”を抑えるトーン調整

旧モデル向けの「徹底的に調査せよ」は、GPT-5では検索多用の無駄を招く場合あり。

必要時のみ深掘りする言い回しに弱める。