ベクトル検索は切り出しの機会になる
__BELOW_IS_AI_GENERATED__
ベクトル検索は切り出しの機会になる 2023-10-06 14:15 omni.icon
note
ベクトル検索は新たな発見の機会である。
digest
ベクトル検索は新視点を提供する。
fragments
pVectorSearch
人間向けUIは面白みに欠け、質問回答は「知らないことは答えない」方向に進化し、面白さを失った。APIを作り、未来の自分が使う道具として、ベクトル検索で該当ページや画像を返す。特に画像の返却は面白い。例えば、「誤った二分法」をリクエストすると、関連画像のURLが返ってくる。また、ランダムではなく、現在書いている文章でベクトル検索を行い、盲点カードを引くことができる。これはScrapboxの「ページ」形式で「画像」と「文章」のペアを蓄積しているからこそ可能である。 pVectorSearch2023-04-29~05-31
人間向けUIは面白くなく、質問回答は「知らないことは答えない」方向に進化した。APIを作り、未来の自分が使う道具として、ベクトル検索で該当ページや画像を返す。特に画像の返却は面白い。例えば、「誤った二分法」をリクエストすると、関連画像のURLが返ってくる。また、ランダムではなく、現在書いている文章でベクトル検索を行い、盲点カードを引くことができる。これはScrapboxの「ページ」形式で「画像」と「文章」のペアを蓄積しているからこそ可能である。 横断ベクトル検索実験メモ2023-09-20
AIによる赤リンクの延伸の検索対象データを増やす実験を行った。検索対象には他人のScrapboxのデータ、書籍や論文が含まれる。生成結果をそのままレビューなしに公開することには何か問題が発生する可能性があるので、出力先は非公開のプライベートプロジェクトにした。
西尾のベクトル検索
横断検索の例として、"コンピュータによって熟議や合意形成を支援することに関して"で検索すると特定の結果が得られる。検索結果の「share」リンクでこのような検索結果のページを開くことができる。
next勉強会
ベクトル検索は自然言語の会話の曖昧検索には良いが、「営業で訪問した相手先企業名」や「製品型番」などでは「見た目のよく似た違うもの」もヒットするのでユーザの認知負荷が高い。
ベクトル検索が有用だった事例
「社会保障費」の話題になり、「社会保障費が高いという話を過去の講演で話したことがあるな」と思い出すが、「社会保障費」で検索しても見つからない。しかし、「社会保障費 科学研究」でベクトル検索したらヒットした。また、壁の穴の話を出そうとして壁とか穴とかで検索するけど見つからず、"壁の穴、近づかないと見えない"でベクトル検索したら見つかった。
digest
「pVectorSearch」、「pVectorSearch2023-04-29~05-31」、「横断ベクトル検索実験メモ2023-09-20」、「西尾のベクトル検索」、「next勉強会」、「ベクトル検索が有用だった事例」の断片から、ベクトル検索は人間向けUIの面白さを失い、質問回答は「知らないことは答えない」方向に進化した。しかし、APIを作り、未来の自分が使う道具として、ベクトル検索で該当ページや画像を返すことが可能である。特に画像の返却は面白い。また、ランダムではなく、現在書いている文章でベクトル検索を行い、盲点カードを引くことができる。これはScrapboxの「ページ」形式で「画像」と「文章」のペアを蓄積しているからこそ可能である。しかし、ベクトル検索は自然言語の会話の曖昧検索には良いが、「営業で訪問した相手先企業名」や「製品型番」などでは「見た目のよく似た違うもの」もヒットするのでユーザの認知負荷が高い。 thought
ベクトル検索は新たな視点を提供し、未来の自分が使う道具として有用である。しかし、ユーザの認知負荷を考慮する必要がある。
title
「ベクトル検索:新視点の提供と認知負荷の考慮」
extra info
titles: ["pVectorSearch", "pVectorSearch2023-04-29~05-31", "横断ベクトル検索実験メモ2023-09-20", "西尾のベクトル検索", "next勉強会", "ベクトル検索が有用だった事例"]
code:fragments
### pVectorSearch
pVectorSearch
2023-04-29
人間がやるためのUIを使ってもあんまり面白くない
プロンプトに積んで質問回答するのは、ハルシネーション対策としてどんどん「知らないことは答えない」方向に教育されていって面白くなくなった
まずAPIを作る
未来の自分が使うための道具として
ベクトル検索して該当ページを返す
自分以外のScrapboxやブログなどを横断検索
ベクトル検索して絵を返す
これが面白そう
例えば「誤った二分法」とリクエストに積むとレスポンスにhttps://gyazo.com/80d45ec33ca8cbb138108d71ad7eec02が返ってくる
誤った二分法.icon
盲点カードをランダムに引くのではなく今書いている文章でのベクトルサーチで引くことができる これはScrapboxの「ページ」という形で「画像」と「文章」のペアを溜め込んでいるからこそできること
2023-05-04
ベクトル検索して画像を見ている事例
2023-05-11
2023/5/16
音声で喋ってる時に音声認識して、自動的にそれをクエリにしてこのScrapboxを検索し、マッチしたものを表示するシステム
### pVectorSearch2023-04-29~05-31
pVectorSearch2023-04-29~05-31
pVectorSearch2023-04-29~05-31
2023-04-29
人間がやるためのUIを使ってもあんまり面白くない
プロンプトに積んで質問回答するのは、ハルシネーション対策としてどんどん「知らないことは答えない」方向に教育されていって面白くなくなった
まずAPIを作る
未来の自分が使うための道具として
ベクトル検索して該当ページを返す
自分以外のScrapboxやブログなどを横断検索
ベクトル検索して絵を返す
これが面白そう
例えば「誤った二分法」とリクエストに積むとレスポンスにhttps://gyazo.com/80d45ec33ca8cbb138108d71ad7eec02が返ってくる
誤った二分法.icon
盲点カードをランダムに引くのではなく今書いている文章でのベクトルサーチで引くことができる これはScrapboxの「ページ」という形で「画像」と「文章」のペアを溜め込んでいるからこそできること
2023-05-04
ベクトル検索して画像を見ている事例
2023-05-11
### 横断ベクトル検索実験メモ2023-09-20
横断ベクトル検索実験メモ2023-09-20
検索対象には他人のScrapboxのデータ、書籍や論文が含まれる
関連
生成結果をそのままレビューなしに公開することには何か問題が発生する可能性があるので、出力先は非公開のプライベートプロジェクトにした
その後のアップデートで検索にヒットした部分をそのままScrapboxに出力するように変えたのではっきりと公開不可能になった
https://gyazo.com/bb1a0bd6cb151fa1b6ffa2d7c498744c
こんな感じで作った赤リンクの先にAIによって自動的にページが生成される
実装
ローカルのpickleからロード
10万件のレコードを読むのに5秒程度
ローカルでベクトル検索を行うのに7秒程度
Webアプリのレスポンスと考えると遅いが、最近の「思いついたキーワードやページを投げておいて別の作業をし、しばらく経ってから見る」というスタイルでは問題にならない
クエリを投げてから僕が結果を確認しに来るまで(計測はしてないけど)10〜25分くらいある
### 西尾のベクトル検索
西尾のベクトル検索
横断検索の例
例えば"コンピュータによって熟議や合意形成を支援することに関して"で検索するとこうなります result 検索結果の「share」リンクでこのような検索結果のページを開くことができます
Term of Service
このサービスにPOSTされたクエリ文字列は管理者が閲覧可能です。また将来的に検索結果の公開ビューを作るかも知れません。
互換性より新しい知見を優先して開発するため、ある時点で使えた機能が別の時点でも使えることを保証しません。
History
権限を得るためのパスワードをもらった人だけ検索対象が増えます
2023-06-07 検索対象に /tkgshn /halsk /yuisekiを追加
今は全体の横断検索だけできます、検索対象のチェックボックスは操作できません
### next勉強会
ベクトル検索、フワッとヒットするので自然言語の会話の曖昧検索には良いが「営業で訪問した相手先企業名」とか「製品型番」とかだと「見た目のよく似た違うもの」もヒットするのでユーザの認知負荷が高い
以下は、入力された情報を要約したものです:gpt.icon
7/29: AIがScrapboxに書き込み、Scrapboxエージェントの概念を紹介。
8月の初めから中旬: オモイカネ勉強会、AIとの連携に関する議論、AIによる研究ノートの執筆、ベクトル検索の進化、及びAI生成ページの取り扱いに関するトピック。
8月の中旬から終わり: マルチヘッド、ページメモリ、ユーザーの認知負荷を考慮した更新と検索に関するトピック。
9月の初め: AIとユーザーとの相互作用、ノートの管理、及び異なるコンテンツ間の関連性を探求。
9月の中旬: マルチヘッドの思考、エンジニアの知的生産術、AIとの連携に関するさまざまなトピック。
9月の後半: LLMと他のモデルの比較、人間の概念に関する議論、Scrapboxの最適な使用方法、及び非公開ツールのフィードバック。
全体として、この期間はScrapboxとAIとの連携、特にベクトル検索やマルチヘッドの概念、AIの思考とユーザーとの相互作用に重点を置いているようです。
### ベクトル検索が有用だった事例
ベクトル検索が有用だった事例
事例1
「社会保障費」の話題になる
「社会保障費が高いという話を過去の講演で話したことがあるな」と思い出す
科学技術に対する投資との比率が焦点だった
見つけようと思うが「社会保障費」で検索しても見つからない
https://gyazo.com/34b6beae7ed4d7d5d95fd0d4d08aaff6
「医療38兆 福祉他24兆 合計120兆」という表現だった
少し離れたところに「科学技術」もある
タイトルに「社会保障費」を入れた抜き書きページを作った
事例2
壁の穴の話を出そうとして壁とか穴とかで検索するけど見つからず
"壁の穴、近づかないと見えない"でベクトル検索
2番目候補で見つかった
https://gyazo.com/9c55e099867137986e3be8ead02a9fdb
generated: 2023-10-06 14:15