GPT-4o
https://gyazo.com/cda5cc71ecf260c8e200ef14c1660e8f
/work4ai/GPT-4o
マルチモーダル
所管
/villagepump/GPT-4o
英会話の練習にいいと思う
https://gyazo.com/904ae0f37415917dba2c3a354a2270e7
これは言語の書き起こし
「流暢さ」というテキストで表れない部分に言及しているのがマルチモーダルのポイント
いい感じのGPTsを作りたいな
後藤さんも英会話してる https://note.com/goto_finance/membership/boards/dde0aa7aa7ed/posts/91cb07fe864c?from=email
マルチモーダルの可能性
まだ画像生成はローンチされていない
2025-03-25 GPT-4oの画像生成としてリリースされた
GPT-4oはGPT-4より音数がマシだがエラーは多い
GPT-4o - Sam Altman Sam Altman
the new voice (and video) mode is the best computer interface I’ve ever used. It feels like AI from the movies; and it’s still a bit surprising to me that it’s real. Getting to human-level response times and expressiveness turns out to be a big change.
Talking to a computer has never felt really natural for me; now it does.As we add (optional) personalization, access to your information, the ability to take actions on your behalf, and more, I can really see an exciting future where we are able to use computers to do much more than ever before.
まだvideoモード使えないんやが
@d_d_osorezan: GPT-4o(新しいバージョンのChatGPT)、今まで苦手だったマンガ画像の読解が格段に得意になってて、ほぼ完璧に解説できるようになってる。
https://pbs.twimg.com/media/GNe5NlWaMAEnLAD.jpg https://pbs.twimg.com/media/GNe5ROHaMAEe_bd.jpg https://pbs.twimg.com/media/GNe5WRUa0AAD2DO.jpg