AIの漠然とした不安感勉強会
今回の目的
今回の講演を見て感情がネガティブに振れる可能性がありますが、事前にそれに配慮することはできません
「漠然とした不安感」が解決されても「明確な不安感」に変わるだけかもしれない 事実と解釈がある
解釈が言語化されていないと「モヤモヤ」「漠然」になる
言語化された解釈を共有する
僕とGPTとの最初の出会い
2022年の未踏ジュニア
NoxicelはAIを用いた、英作文を通じて英単語を学習するアプリです。英作文によって、英単語を文脈や文法と共に覚えることができます。また、教師がいない場面でも気軽に英作文ができるように、OpenAIの技術を使用し文法や用法等の提案をします。
公開は11月だがもちろん5月の応募段階で気にかけていた
採択されたのでプロジェクトの様子を見ていて、夏頃には自分でもAPIを試してみた
当時は補完APIをPlaygroundで使う形だった
当時の感想「なるほどねー、意外と色々できる。でも英語ならそれなりだけど、僕がやりたい日本語での知的生産性向上にはまだ使えないなー」
そして11月にChatGPTがでた
https://gyazo.com/4787915e5f1d45d41bdcac568e537415
https://gyazo.com/46db2b3ae5615b9283790beb9b22b655https://gyazo.com/6fe8963c09ac65df72477caceba6a8ad
https://gyazo.com/fde07f3096855a4cdcce74aaa150b2f5https://gyazo.com/d337683f062f8075462b1d2748dbb676
https://gyazo.com/4e15e58d1a52aa92e20e805fea5a92f7
https://gyazo.com/e365e373b77c9c66d3bc6689ff3218e8https://gyazo.com/9bf9e05ce092b6d167c53e15005a050a
各10回試しても、まだ4割ぐらいは「何もしない」を選択する
100回試せば割といい結果になる
10回試した程度では1.5倍の価値(成功確率,期待値)の差を理解するには足りない
少ないサンプル数で価値を低く見積もってしまうと、さらにサンプル数を増やす行動が行われなくなるので、無知の状態から脱出できなくなる
→悲観的勘違いをしたことを反省してとにかくたくさん使うことにした
補足: この実験は「ランダム」だが、実際には「使えば使うほど上手く使えるようになる=期待値が上昇する」効果もある
英語と日本語の性能差
ChatGPTを使う体験をどんどんやっていった
英語と日本語の性能差を感じた
「感じる」だけではないことが5/2のGPT4リリースで明確になった
https://gyazo.com/9ca6bce95209e6482df37dc987a79e4b GPT-4 https://gyazo.com/33d7682854815155719d77b07ed13bc5
同じシステムを、同じ費用を払って使っていても、日本語などのマイノリティ言語の話者は英語話者に比べて得られるものが少ない
この格差は広がっていくのか縮まっていくのか?
https://gyazo.com/d922292d7f81ae2f6a362666019d9da7
A: 広がっていく
指数関数的発展の素直な解釈
B: なぜか遅れてる側が加速して追いつく
神風が吹くとか?
C: どこかで飽和して、遅れて追いつく
AなのかCなのかは知り得ない
(Bは…希望的感想だよね…)
Aだとするなら
英語を使う国やチームは、日本語を使う国やチームよりもより大きな便益をAIの進歩から受け取る
国際的な競争力を考えたときに、日本語などのマイノリティ言語を使っていることは不利
とはいえ「じゃあ社内公用語を英語にするね」が機能するとは思えない
アウトプットのハードルが上がってコミュニケーションが抑制されるから
どうしたらいいかわからないけどとりあえず自分のScrapboxを毎日DeepLで自動的に英訳する仕組みを作った(3/25)
近々GPTを使った翻訳に切り替える予定
明治の日本は、高等教育を自国語でできるようにすることが大事だと考えた
before LLMの時代には、それは良い判断だったように見える
after LLMの時代に、これが呪いにならないか不安
英語を話す発展途上国は、英語を話す先進国で今後発生する「教育のイノベーション」の恩恵を直接受け取ることができる
教育における双方向インタラクションが「人間の教師」に負荷集中する問題が、教師をAIで支援してスケールさせることによって解消される
マイノリティ言語話者はこのイノベーションに遅れることになる
0/1ではなく、LLM以前からすでに発生していた傾向でもある
ソフトウェアエンジニアが新しいライブラリを使おうとしたり言語やブラウザの世界標準を確認しようとしたとき「英語を読まなければならない」という事態がしばしば発生していた
その対象となる人や分野が広がっていく
Q&A
human.iconマイノリティ言語を使うことによるオーバーヘッドはあるが、それは指数関数的に広がって行かないので、全体の効用が指数関数的に広がって行くなら全体の中での割合は減少していく
nishio.icon確かにその世界線はある、AとBの間に2本の線が平行線になるものがあるわけだ
human.icon機械翻訳でなんとかなる論
human.icon専門用語や社内用語などが元に戻る保証がない
nishio.icon企業の実務には世の中で使われてない単語や「なになに株式会社」「なになにさん」みたいな固有のキーワードがたくさん出現する。翻訳によってどの程度破壊されるか。例えば「西尾泰和」が元に戻らないw
human.iconもっと時代が進んで、AI同士が情報交換するようになると、もはや英語も第一言語ではなくなるかも
nishio.icon多分それはSimpified EnglishにJSONやPythonが混ざった言語になる
情報の分断
3/8に自分のScrapboxをChatGPTにつないで、ChatGPTがこのScrapboxを参照した上で反応を返せるようにした
いまではRAGと呼ばれてバズワード化してる
Toolformer: LLMが外部ツールを使う方向性
を、今後の方向性として話した
https://pbs.twimg.com/media/Fr7DEc0WcAgD7V6?format=jpg&name=small#.png
事前にPluginsのことを知らされた企業と知らされなかった企業がある
gdb Thank you to our amazing set of launch partners — Expedia, FiscalNote, Instacart, KAYAK, Klarna, Milo, OpenTable, Shopify, Slack, Speak, Wolfram, and Zapier. Each has built a very cool integration! https://gyazo.com/9a1b08484fb77e6ef3efcb57ddd27f5d
https://gyazo.com/b623b59a9baf00fb43ee174e5edea94c
世界のちぎれ
この時期に「世界のちぎれ」という概念が結晶化した
この時期の思考をトレースしてみよう
まだらな未来とは
「未来から来ました!」 奥田 浩美の講演はこの言葉から始まります。勿論2050年とかからタイムマシンに乗ってきたわけではありません。未来は現実の世界で”まだら”に存在していて、すでに一部のビジョナリーリーダーには「在りたい未来」が見えています。見えているどころか、すでにその未来の姿を生きているのです。 未来は、現実の世界においてすでに「まだら」に存在しています。... 私はすでに私にとっての「こうありたい未来」が見えていて、その未来の働き方の一部を育児や介護を通じて実践しています。それがいつも数年後に常識化するという意味で「未来から来ました」と言っています。 とはいえ…そんな一部の”勝手な行動ができる人は恵まれた人だけ”、”現実は…”みたいな「世間の常識」を語られますが、そこを越えた現実がどんどん広がり、現実がどんどん破壊されていっています。その破壊されたところに「まだら」に未来人が住んでいるのです。私はそんな「まだらな」未来人の一人です。 「まだらな未来」のある世界、今までA1からA2へと変化していくと思っていたのだけど、今観測してることはB1からB2への変化のように見える https://gyazo.com/3ec376e93509a9239553d49e9d837d01
https://gyazo.com/9c21e3a0e0505b2b2ae0acfb289be1a2
引き伸ばされた世界がちぎれてしまった後、何が起きるのか
気候が変わってゆっくりと農耕に適さなくなっていく
わからない
施しをするパターン
村は農業がなりたたなくなっていくが、旅人の施しによって生き延びることができる
もはや訪れる価値などないパターン
顧みられることのなくなった村が衰退して滅びていく
旅人の側は滅びゆく村から未来のある若者を助け出したと解釈している
若者は自分が面白いと思う側の道を選んだと解釈している human.icon連れていくのはwin-winっぽい
nishio.icon村を出て行く若者と連れて行く旅人はwin-winで、村に残る人が激おこする構図かも
アーリーアダプター集団の形成
時系列変化
https://gyazo.com/021b423bfcdd114680ded6b77d30c194
一般には高次元だと思うが図解の都合で1次元に並べている
近くにいる人だけがそれを観測する
t=3 観測した人の中にも移動する人と移動しない人がいる
移動しない人Bは情報の伝達をブロックするのでその先の人は動きを観測できない
t=4
https://gyazo.com/e62a32d5e773893447c488ef6d7aabfa
このところどころに現れた「アーリーアダプター集団」の間に新たな人的ネットワークが形成される 移動した先が正しいかどうかとは独立
移動先で周囲を見てイマイチだと思ったらさらに移動するだけ
この「2ステップ先の世界」は元々の世界の人からは本格的に観測困難になる 1ステップ先の世界が良いかどうかはむしろあまり重要ではなく、腰が軽い人との情報接続を維持することの価値の方がウェイト大きいかも?
human.icon2ステップ先に進んだ人は、0ステップの人に呼び掛けたりはしない?
nishio.iconそれが「旅人が村を訪れる」だと思う
メリットの有無などの議論も同様で、メリットがあればやるし、なければやらない
津波てんでんことも繋がってて「逃げて走ってる段階ではそれをやる余裕がない」「落ち着いて余裕ができてから救助活動が行われる」というイメージ
どう生きていくのかという悩み
「津波が来たら、いち早く各自てんでんばらばらに高台へ逃げろ」
他の人が動くかどうかは関係ない、自分で判断する
利己と利他の適切なバランス
防災アナウンスを鳴らした、声の届く範囲の人に声を掛けた、それで十分
津波の場合は「高いところ」に逃げれば良いことが既知 2023/9/16加筆
津波が来るか来ないかは不確定
来ると仮定して高台に走る
来ないと仮定して留まってる人を説得するために留まってはいけない
神が存在する方に賭ける方が得という話
これは賭け=不確実性マネジメント
物理的身体と違って分人ができるから複数の選択肢に賭けることができる
LLM meetup(4/10)
takahiroanno 都内某所で行われたLLM meetupに行ってきたけどめっちゃ良かった。参加者は全員LLM関連のデモ持ってこないと参加不可というハイブローなmeetupだったんだけど、50人ぐらいきてた。参加者がひたすら蒸留されてて、LLM無職がたくさんいた。一つの時代のはじまりを感じたよおれは kenn 自分もLLM無職です!まじめな話、スタートアップの始まりなんて無職と何も変わらんので、どうせ無職やるなら会社はじめるのがいいよね。自分のモチベ操作的な意味で。作ってしまえば案外なんとかなるし、なんとかならなくても元から無職だし。笑 human.iconnishioさんもどう生きていくか悩むことがあるのですね
nishio.icon問題は理想と現実のギャップなので、理想を高くするほど問題も大きくなる。
僕一人で生きてくだけならなんとでもなるとは思うけど、転職活動とかめんどくさいのでやりたくないから理想としてはサイボウズが健全な経営状態をあと20年保ってほしくて、20年のスパンを考えるために20年前のサイボウズと今を比較すると、まあ同程度の変化があると考えるのが自然かなと。(AIで加速する可能性を考慮しなかったとしても)
で、変化が必然なら「どう変化するべきか」が問いになる、という流れ。
書籍を書くことに対するネガティブな気持ち
最初の書籍「Jythonプログラミング」書いてる最中にバージョンアップ、出版して数年で陳腐化
10年陳腐化しない本を書くぞという気持ちで書いたのが「コーディングを支える技術」(2013)
今年、改訂版を出す話が持ち上がった、10年売れ続けてきた証拠
改訂版が出るということは書籍の有益さのシグナリングなので引き受けようとしていた
1月には「この10年のプログラミング言語の変化」の準備をやってた
が、辞めた。次の10年のスコープで考えた時に書籍という媒体に存在意義が見出せなかった
知識の伝達形式として書籍は適切なのか???
nishio 知識パッケージの作成って実は人間が読むためのドキュメントを作るよりも楽。というのは人間は短期記憶が限られてるので「良い順番」で知識を与えてやる必要があって、執筆者からするとこれがとてもしんどいのだけど、LLMに与える時には順番は関係ないから思いついたことをどんどん書けばいい nishio むしろユーザの質問をもとに「何が足りてない情報か」を特定してそれを追加していく作業をガンガン回す方が良いし、それをやるためのシステム作りが重要になる 速やかにScrapboxで公開し、翌日には英訳、半年経ってから「半年前のこの時にこう書いて公開したけど」と言及する
RAG: Retrieval-Augmented Generation
LLMが賢くても、公開されてない社内情報のことは知らない
検索で知識を補うのがRAGのアプローチ
この検索を改善していくことに価値がある!
7/18 Azure Cognitive Search
https://gyazo.com/8e2fa02e91d9ee1566bd48aeb6008048
活路を見出したと思って進んだ先にローマ兵がいた気持ち
ローマ帝国=Microsoft帝国
どこにいってもローマ
GPUが高価なリソースで、一つのGPUで出せるスループットに限界があるので、世界全体から十分な需要があるサービス提供者は負荷を平準化して効率よくGPUを使えて、そうでないサービス提供者は低負荷時にGPUを遊ばせてしまって何倍も使用効率が落ちてしまう
顧客が全世界のタイムゾーンに散ってるサービス提供者と比べて、例えば日本に顧客が集中してるようなサービス提供者はリソースの使用効率が何倍も悪くなってしまう
「Maiaは…そしてすでにGitHub Copilotを含む多くの我々のサービスで使われている。まず我々のワークロードで使い始め、その後サードパーティのワークロードへも展開していく」(ナデラCEO)
垂直統合とは、企業グループが、製品やサービスを供給するためのバリューチェーンに沿って、付加価値の源泉となる工程を取り込むことをいいます。
電力・チップからサービスまで統合しつつある
現状の製品の設計を前提にして汎用の機能としてLLM機能の追加を考えることは現状の抽象度を暗黙に仮定することになる
Cybozu Days Keynoteで「今はインターネット黎明期のようなもの」と話した
「見つけるべきもの」がなんなのかまだわからないが、それが既存製品と連続的なものだと思い込んではいけない
ある公園の街灯の下で、何かを探している男がいた。そこに通りかかった人が、その男に「何を探しているのか」と尋ねた。すると、その男は、「家の鍵を失くしたので探している」と言った。通りかかりの人は、それを気の毒に思って、しばらく一緒に探したが、鍵は見つからなかった。そこで、通りかかりの人は、男に「本当にここで鍵を失くしたのか」と訊いた。すると、男は、平然としてこう応えた。「いや、鍵を失くしたのは、あっちの暗いほうなんですが、あそこは暗くて何も見えないから、光の当たっているこっちを探しているんです」
1の入力で2の出力が出てた変換装置が、3の出力を出すようになるのが生産性の向上
https://gyazo.com/7e43ba6b41944dfd1a204ba4b60c6ceb
この時に下流のネットワークに十分な需要があるなら効率がアップする
たとえば「実装すべき機能がたくさんあるけどエンジニアの手が足りてない」的な状況ではよりたくさんの機能を実装できるようになる
未充足の需要がたくさんあるから
しかし需要がないなら下流の在庫が積み上がったりベルトコンベアが埋まったりしてその生産装置の稼働率が下がる
企業の税務処理のタスクはだいたい充足されていて、1.5倍に需要が増えたりしない
なので1.5倍の生産性向上が起きたら3人に1人必要なくなる
この時、アメリカでは不要になった人を解雇する
nishio 稼働が下がったホワイトカラー、溢れてるボールを拾いにいったり、自発的兼任したり、新しい部署を作ったり、という形でアジリティを出す選択肢があって、ジョブデスクリプションで強く縛ってるとその妨げになるよな感、社内を個々人が移動できる全社的情報共有がAI時代のアジリティに重要かも グループウェアのステマです()
https://gyazo.com/10b5f769e2fcdf566daec049ad5a437f
自発的か会社の命令かによらず"社内を個々人が移動"が発生していく
どこに移動していくかというと:
追記: 少数だけどもちろん「経営者」に移動する人もいるだろう
どうすれば良いのか
何をやっていくのが正しいのか
議論しても多分コンセンサスに至らない
コンセンサスに至るのを待つことはよくないことだと思う
勝手に色々やっていく
僕の今のターゲット: 要約
自分が本を読んで理解するプロセスで何が行われているのか
書籍全体よりもデータ量の少ない表現になっていってる
広い意味で「要約」
その上でリンクの接続が行われている
「要約」という言葉で表現されるタスクにおそらくいくつかのことなったものがある
それを表現する言葉が熟してないため言葉でLLMに指示をすることが困難
一方で「大きな入力を受け取るタスク」なのでFew shotsの事例でやってほしいことを表現するのも困難
データを作ってファインチューニング
この方針が正しいかどうかはわからないし数ヶ月後にはまた別のことをしているかもしれない
だが思考によって「やってみなければわからないこと」の森の入り口に到達したので、分け入ってみるしかない
Q&A
human.iconそんなに変化しないのでは
nishio.iconそうかもしれないし、そうでないかもしれない。正常性バイアスで「変化しない」側に認知が偏る傾向がある。