LLMによる知的生産性向上勉強会
単なる検索、単なるベクトル検索よりも組み合わせた方が精度が高い
こういうものが利用可能になっていく時代
リランカー≒「200件の検索結果を見て良い順に並べ替える小人さん」
Fusion in Decoder≒「100件の検索結果を読んで文章を書く小人さん」
「医療38兆 福祉他24兆 合計120兆」と書いた情報に、「社会保障費 科学研究」でヒットする
「進む先に壁があることは進まない理由にはならない」ページに、「壁の穴、近づかないと見えない」でヒットする
「こういう『文字列』を書いたはずだ」ではなく「こういう『意味』のことを書いたはずだ」で検索することが可能になってる
ChatGPTとは違う
ユーザが「自炊の経験について教えて」と入力して「あっ、使い方を全然理解してないな」と思った
ChatGPTがそうであるからという理由で似た入力をしてしまう
ChatGPTはInstruction Tuning
ベクトル検索は意味的に似ているクエリをいかに書くかsta.icon
ベクトル検索だけで完結する?
Ans: いいや
HelpFellみたいに表記ゆれに先手撃つアプローチもあるよね
今は文章全体から埋め込みベクトルが作れる時代なので文意が一意になるように文章を書けばいい。1単語だけを見たときに語義が複数あっても問題にならない。
多義語も扱いたいなー、に対するカウンター
ああ、プロンプトエンジニアリングもそうだが、国語力求められる感じだなぁsta.icon
AIノート扱いにするノートを人間が選べるって話だったのかsta.icon
人間が「この話題を発展させたいな」と思ったメモをシードとして書いて、それをAIノート扱いにする(当時の実装ではタイトルに「🤖🔁」を付ける)
俺は単に「ある文章群の続き」をnパターンを出す(AIさんならnパターンひねり出すことも容易い)、だと理解していたよsta.icon
赤リンクによる延伸の話
赤リンク[xxx]を書いておいて、AIにxxxを指定すれば、AIがxxxの中身を書いてくれる
が、まだわからないsta.icon
hints
「AIによる赤リンクの延伸」は人間が「検索の意図」を書き込み、AIが「検索して、それを読んで解説の叩き台を書く」までやるので、検索後の人間の行動はオプショナルになる
検索結果は編集をアフォードしない(発生させない)、と表現している
ちょっとわかったかもsta.icon
赤リンク[xxx]をつくってAIに書かせるという行為は、xxxで検索する、の一種と言える
通常の検索と違うのは、
AIがその場で検索結果をつくること(ベクトル検索が使われている。意味的に似たやつをつくってくる)
生成された検索結果(ページxxxの中身)はいじれる
ああ、そうか、ベクトル検索は意味的な検索だから、nishio.iconは赤リンクをつけることを「検索 "の意図"」と表現しているのかsta.icon
ChatGPTとomniのユースケースの違い
omniとはここで取り上げてる、AIにノートを書かせるRAGのこと nishio あまり多くの人が区別していないかも知れないけど「言語化をする」というプロセスに「世界を記述する解像度を高める」と「高い解像度での観察によって得られた理解を他の人に伝わる形で記述し直す」とがあり、これは別物なのでそれぞれわけて考える必要がある ChatGPTは後者
omniは前者
nishio.iconは「自分が書いた語彙を説明なしで使ってくる、24h動く自分の知能のクローン」的な表現をしている
非公開omni
publicにできない情報も検索対象にした
書籍情報とか他人のベクトルとか
ベクトル検索だけでかなり面白い
「本棚の前で語ると本が飛び出してきて関連したページが開く仕組み」をイメージしてもらえれば、そりゃ面白いよねという気持ちはわかってもらえるのではないか
他人のScrapboxがヒットした場合は「Xさん、こんなことを書いてたのか〜」と面白く読んでる、その後のコミュニケーションにつながるかも
めっちゃ面白そうsta.icon*2
前提として、
ベクトル検索は切り出しの機会になる
要は時系列で並んだノートを人間が見て切り出しを考えるのは負担が高い(し普通はいちいちそんなことしない……)が、ベクトル検索するとサクッと要点や重要なとこを出してくれる
切り出しという行動をしやすくなる
時系列で並んだノート?
日記、チャットログ、講演資料、会話の文字起こしなど「時間軸で並んだ記述」がある
ベクトル検索は認知の解像度を高める道具として機能する
ベクトル検索により「似た情報」が提示される
知的生産者の目線では「一般化・抽象化するためのヒント」が増えてくる感じ
知的生産(概念の蒸留)しやすいsta.icon
「似た話題」と「似た意見」は違う
似たトピックに関する異なる意見はベクトル検索的には割と近い
これ面白いなと思ったsta.icon