日記2024-05-14

overlast いやー、これはかっこいい。音声認識と音声合成と音声チャットサービスに対する最低ラインがググっとあがった。これが任意の言語と声質で実施できる様になる日も遠く無いし、OpenAI 以外でもできる様になっていく。同時に人間に対する期待値も上がる。今後の人間は相当に柔軟性を求められる様になる

ImAI_Eruel OpenAIくん，GoogleのGeminiが最初デモ動画で界隈をびっくりさせるも「結局色々と組み合わせたフェイクっぽいやつだった」と話題になった「人間とほぼリアルタイムに会話&動画認識しながら作業を遂行」を生放送でやってみせる

https://pbs.twimg.com/media/GNeZ2mqaMAAd28p?format=jpg&name=medium#.png

ImAI_Eruel ただ，これはGoogleが割と近いうちにやってくるんではないかと思っています（主要なデータ供給源のYouTubeが傘下にあるので，動画関連ではGoogleが勝つと思っている）

LiamFedus GPT-4o is our new state-of-the-art frontier model. We’ve been testing a version on the LMSys arena as im-also-a-good-gpt2-chatbot . Here’s how it’s been doing.

GPT-4oは、当社の新しい最先端フロンティアモデルです。LMSysアリーナでim-also-a-good-gpt2-chatbot としてバージョンをテストしています。その様子をご紹介しましょう。

https://gyazo.com/27fa3e87f18fef390bd98ea9dda0ac25

hiro_gamo みんなで一生懸命GPT-4に追いつこうとしてたのに無慈悲過ぎる。しかも価格も半額で速度も2倍。

前にも書いたけどOpenAIは1社だけ進化が非連続的なんよ…。

nishio OpenAI's launch of a desktop app is a strategic move to compete with Google's vast repository of 'videos taken by people to show to others' on YouTube. They aim to gather data from 'screens people watch while working' every day, gaining an edge in the data war.

OpenAIのデスクトップアプリのローンチは、YouTubeで「他の人に見せるための動画」の膨大なリポジトリを持つGoogleに対抗するための戦略的な動きです。彼らは、毎日「人々が仕事中に見る画面」からデータを収集し、データ戦争で優位に立つことを目指しています。

Sonnet

Input: $3 / MTok

Output: $15 / MTok

Opus

Input: $15 / MTok

Output: $75 / MTok

gpt-4o

Input: $5 / 1M tokens

Output: $15 / 1M tokens

Gemini 1.5 Pro

Input: $7 / 1M tokens

Output: $21 / / 1M tokens

gpt-4-turbo

$10.00 / 1M tokens

$30.00 / 1M tokens

gpt-4

$30.00 / 1M tokens

$60.00 / 1M tokens

gpt-4-32k

$60.00 / 1M tokens

$120.00 / 1M tokens

Claudeのコンテキストが200K contextでGPTの128K contextより長いとはいえOpus比較で3倍安く、しかも日本語トークナイザで1.3倍のバフがかかるとなるとなー

GPT-4o

The message you submitted was too long, please reload the conversation and submit something shorter.

87K token

日記2024-05-13←日記2024-05-14→日記2024-05-15

100日前日記2024-02-04

1年前日記2023-05-14