GPT-4V(ision)
OpenAIのブログで発表された情報によれば、ChatGPTが視覚・聴覚機能を取得し、これによりマルチモーダルなコミュニケーションが実現されました。次の2週間の間に順次展開される予定で、PlusユーザーはChatGPTとの音声対話が使用可能になるとのことです。 主な注目ポイント:
・ChatGPTは画像や音声データを解析・応答する能力を持つ
・ユーザーとのコミュニケーションが多彩になることに期待
・OpenAIはこの技術の背後となるリサーチを公開予定
OpenAIは以前から高性能なテキストモデルの開発を続けてきましたが、今回のアップデートでよりダイナミックなインタラクションが可能になることが予想されます。
追加情報:
・マルチモーダルコミュニケーションは、視覚や聴覚を組み合わせることで、よりリッチなユーザーエクスペリエンスを提供する技術 ・実際の利用方法やAPIの詳細については公式ブログでの発表を待つ必要がある
https://video.twimg.com/amplify_video/1706284869431824384/vid/avc1/296x640/PpfUljLuRWyYD8KE.mp4?tag=14#.mp4
きたきたwogikaze.icon