日記2023-09-30
まだScrapboxにきてない資料があるな
過去の講演の質疑をAIが掘り起こす
少しずつ見えてきている
チャンクの作り方の工夫
人間への提示の仕方の工夫
検索の工夫
これはリンクがついていなかった
2018年4月なので、まだ僕がScrapboxを使い方をよくわかっていなかったのだ
https://gyazo.com/918471c6dd11a44549d949d3cd98542b
それがomniのベクトル検索で発見された
Scrapboxのリンク曖昧検索によって「リンクを書こうとしている時に過去の関連したリンクが曖昧検索されるのと似た構図
Scrapboxの「リンクがたくさんたまらないと価値が発生しにくい」問題の解決
LLMによって人間だけでなくコンピュータも自然言語で実装できるようになった
人間+コンピュータ=増強された人間
FORTRAN(1954)
文字起こしの一部にヒットして切り出される
いらないところを削除する
検索結果をページに出力するかどうか
検索結果がインデックスに入るのは良くない
タイトルと断片の対応づけがスポイルされるから
検索結果を出力すべきか
出力結果を読まずに捨ててないから、出力に価値はある
「要約に表れてないけど、これ面白いじゃん」ということが割とある
一方で「切り取られた断片」を読むことは割と認知的な負担が大きい
本当はもっとうまく要約できるといいんだけどな
出力した上で検索対象にしないことが必要
→チャンクの作り方の工夫