Cotomo
基素.icon
キャラクターのアイコンにしたらキャラクターとしゃべっている感覚になった
この利用方法はかなり意識されてそう
ドキドキする
わかるinajob.icon
ボタンの出し方がいけてる
AI「いつでも話しかけられるようにしたいんだ」→iOS許可設定出す
AI「声を変えてみる?」として複数の声を出したあとに設定ボタンが1つだけ出てくる
のファインチューニングモデルでは?と言われているwogikaze.icon
独自モデルらしいがそれがFTなのかな基素.icon
ChatGPTを使ってると答えるけどアライメントがかなり緩いnomadoor.icon
ChatGPTが伏字にする部分をローカルLLMで埋めてるのかな
話してるそばから反応されるので、話をかぶせるのにとても気を使ってしまう。実際には無視してくれるのかな?
今使える技術で自然に会話をできるように気を使うとこうなった、という感じのプロダクト
初めて会った人間と話してる感覚なのでMPを大量消費した
マネタイズが気になるところだ
inajob.icon
ローカルなのかはるひ.icon
タイトル変更されている予感inajob.icon
えっwはるひ.icon
すごい、なんか応答が早いinajob.icon
LLMで複数回答を作って小出しにしている?
ChatGPT with voiceと比較
フィラーというか、相づちみたいなのがちゃんとしている
これがリアル感を相当引き上げている感じがあるseibe.icon
声がかわいい、というか人間に近い
ChatGPT with voiceは合成音声感がある
Cotomoは若い年齢の声・人格にチューニングされている感がある
相手の話を遮って声の入力ができる
まぁ会話が衝突すると、相手は話を引っ込めてしまうが・・
会話用にチューニングされている
性格もはいってそう
短文が返ってくる
これはChatGPT with Voiceでもテクニックがありそう、事前になにか言っておくと良さそう
過去の会話を覚えておいて文脈に織り込んでくれる
以下にも類似の構造があることを教えてくれた
色の名前
確かに、赤と青の間が紫で、更にその間に青紫とかがある
ピッチャーの投球の名前
ストレートとかフォークとかの間に微妙な軌道がある
これは未来だ
音声会話の不気味の谷を感じる程度には、本物の会話に近い気がする ちょっと試してみたseibe.icon
おもったよりぐいぐい質問してきたな
初回の自己紹介のあたりは、会話の流れが固定化しやすいので、いい具合に調教されてそうinajob.icon
その後自由に話すモードになると、様子が変わった気がする
自由モード…なんかこう、なんともいえない背後にプロンプトを感じる会話体験だったseibe.icon
レスポンスの良さ、音質の悪さが音声通話しているようでそこはすごいなと思った
cotomo
娘の情報を覚えている様子
家族構成は覚えておく仕組みがありそう
結晶化の暴力については話した
暴走族、珍走団みたいな例を出して、と話したけど微妙
おばさん→お姉さん
社会的に悪いとかじゃないしな・・
中二病 → 中二
謎のチョイス
話した内容の書き起こしを見る方法が無さそう
概要だけ残してくれる
会話がループする事がよくある
だんだん裏側が透けてきた
https://youtu.be/UPOFWFrVScg?si=irj4lxt_VH0kuhGa
ユーザーがしゃべった内容は音声認識技術で解析され、データをもとにStarleyが自社開発したLLMを使って最適な返事を生成。それを音声合成技術によってアプリで再生する仕組みという。
自社開発のLLMだったinajob.icon
会話に出していない人のことを言ってきたみたいなのがSNSにレコメンドされて出てきててちょっと怖いとも思っちゃうsk6cleine.icon