自分用の検索エンジン
2021-06-24
そういう意味では裁断スキャンしてOCRした書籍の横断検索ができるようにしてるって話、まさに自分用の検索エンジンを使ってると言える
それの話、書いたかな?
自分検索エンジン(2018-10-18)
本の内容や自分の過去のブログ記事、他人の記事などを記憶していて、僕が今考えていることを読んで、そこから連想して提示するシステムが欲しい
これのPoorな実装は、僕がキーワードを入力して、そのキーワードを含む文章を返す「検索エンジン」だ まずはこのPoorな「検索エンジン」があるべきではないか?
実はsilver_searcherでデータフォルダ内をがすっと検索するプログラムはある
書籍PDFを1ページ1行で出力してあるので、ヒットしたファイル名とその行番号を見ればどの本の何ページにあるかがわかる
これでは何が不足か?
最新に保つ手段が不明
前にデータを作ったのは大分前なのでもう忘れた
Facebookを検索対象にするにはdumpfbを使うはずだが… 書籍はどこまで検索対象に加えたかな…
公開できないタイプのデータ源は公開の場所に書いてないので自分自身が忘れてしまう
非公開でも書いておくべき
公開できるものは公開してGoogleなどの検索に任せた方が良い
クエリを決めなければいけない
例えばScrapboxにここまで書いたところで、ワンクリックで「この文章全体」をクエリとして検索ができて欲しい
2023-12-19
例えばScrapboxにここまで書いたところで、ワンクリックで「この文章全体」をクエリとして検索ができて欲しい
まだワンクリックではないが文章による検索ができる