GPT-4o
Perplexity AI.icon========
主な特徴
高速な音声応答
GPT-4oの最大の特徴は、音声入力に対して平均320ミリ秒(最短232ミリ秒)で応答できる高速な処理能力です。これは人間の会話における応答時間とほぼ同じ速さで、従来モデルの大幅な遅延を解消しています。
マルチモーダル入出力
GPT-4oは単一のモデルでテキスト、音声、画像の入出力を一体化して処理できます。従来は別々のモデルを組み合わせていたため情報が失われていましたが、GPT-4oではエンドツーエンドで学習されています。
高い言語・マルチタスク性能
GPT-4oは英語のテキスト・コーディングタスクでGPT-4 Turboに匹敵し、非英語言語のテキストでも大幅に改善されています。さまざまなベンチマークでも高い成績を収めています。
APIの高速化と低価格化
GPT-4oのAPIは従来モデルに比べて大幅に高速化され、価格は半額になっています。
期待される用途
リアルタイムの音声対話、マルチリンガル対話、画像を活用した対話、動画の理解と説明など、GPT-4oの登場により人とAIの自然なインタラクションが可能になると期待されています。
========
知識のカットオフ
なぜかGPT-4の2023-12に対してGPT-4oは2023-10だった