LLMによって増強された思考プロセス
takahiroanno 未踏ジュニアのクリエイター、みんな凄かったんだけど、最年少の小学生五年生の上田さんの発表は特に印象に残った。彼には場面緘黙があり、話がしたいのに声が出せないので人と話せない。 そこで彼は、ChatGPTに聞きながらプログラミングを学び、音声認識、合成音声、LLMを組み合わせ人と音声で会話できるアプリ「Be Free」を開発した
小学五年生の彼が自作のアプリを駆使しながら、大人びた合成音声で喋るさまはめちゃめちゃ印象的だった(VIVANTのドラムを思い出す)
彼の発表は下記リンクから見れるのでとにかくみてみてください takahiroanno Be Freeは会話の音声認識をして、まずChatGPTが「返答に含まれる単語の候補」を生成する。ユーザーは単語を1個以上選択する。ChatGPTは単語候補と会話文脈を元に返答すべき文章を単語から想像し、候補を提示するという流れだ。 インタラクションとして面白い以上に、そもそも自分が文章を考える時に脳内で何が起きているのか想像が膨らむ。自分も思考するときに適当に単語が脳内にpopして、そこからいい感じに文章の形に整形しているだけな気がする。というかそういう意味でいうとそもそも思考の主体は脳じゃなくてやはり言語文法(というか言語モデル)の側に宿っているのかもしれない・・・とか色々おもった
takahiroanno 抽象的に言えば、LLMを使い倒しながら、LLMを自分の発話プロセス(≒思考プロセス)に組み込むアプリを作るクリエイターが出現してきているわけで、新世代の出現を感じる nishio なるほど、LLMによって増強された思考プロセスの一形態と捉えることができるのか、熱い