GPT-4.5
https://gyazo.com/cda5cc71ecf260c8e200ef14c1660e8f
GPT-4.5 が登場 | OpenAI
感情知能の大幅向上
Hallucinationの減少
具体的な数値(SimpleQA)
正答率:62.5%(GPT-4oは38.2%)
ハルシネーション率:37.1%(GPT-4oは61.8%)
o1との違い
CoTなし
5分間の会話でのTuring testをpassした
@ai_database: OpenAI社が提供するLLM「GPT-4.5」がチューリングテストに合格したとの発表です。カリフォルニア大学の研究チームによる報告。
人間の審査員が人間とAIを見分けようとした結果、73%の割合で人間ではなくGPT-4.5が”人間”と判定される結果だったと報告されています。
https://pbs.twimg.com/media/Gnch1z8a4AAyNqo.jpg