検索システムと推薦システム
推薦システム
推薦システム実践入門
検索エンジンの仕組み
Twitterのソースコードから推薦システムを解剖したい
ElasticSearch
NLP若手の会
キーワード検索
ElasticSearch, Apache Solr, Whoosh
データベース
PostgreSQL, MySQL
正規表現
構文解析
Spacy, NLTK
IRモデル
tf-idf, okapi bm25
ベクトル検索
bert, transformer, chatgpt(?)
検索エンジンはなぜ見つけるのか?
1章 検索エンジンの目指すもの
2章 集める
3章 整理する
4章 検索する
5章
機械学習による検索ランキング改善ガイド
https://www.oreilly.co.jp/books/9784814400300/
ウェブサイトなどで検索を行う際には、多数のドキュメントから検索結果の候補を見つけ出す「マッチング」、その結果を望ましい順序に並べ替える「ランキング」という2つの操作が行なわれています。本書はこのうち「ランキング」の改善に機械学習のアプローチを導入することによって、検索結果の質を高めるプロセスを解説する書籍です。
第Ⅰ部では、機械学習を用いたランキングモデルの導入だけでなく、従来手法での改善、またモデルそのものの改善や各種のテストなど、機械学習システムを導入、運用するプロジェクトの全体を幅広く紹介します。第Ⅱ部ではサンプルのシステムを実際に動作させて、その挙動を体験するハンズオンを行います。巻末の付録では「ベクトル検索と機械学習」について解説しています。
「極めてシンプルでありながらBERT等の既存の深層学習手法を上回る」として話題の「gzipによるセマンティック検索」の実装と直感的な説明をGitHub Gistに掲載しました
https://twitter.com/kyo_takano/status/1680131588947079168?s=20
グラフを用いた近似最近傍探索の理論と応用
https://speakerdeck.com/matsui_528/gurahuwoyong-itajin-si-zui-jin-bang-tan-suo-noli-lun-toying-yong
LLM時代の検索
https://layerx.connpass.com/event/359071/presentation/?utm_campaign=new_event_links_to_group_member&utm_source=notifications&utm_medium=email&utm_content=detail_btn
検索結果の品質向上
https://speakerdeck.com/recruitengineers/improvement-of-the-quality-of-search-results
Kenneth Stanley
https://en.wikipedia.org/wiki/Kenneth_Stanley
新規性探索アルゴリズムとは
https://note.com/mizuki_oka/n/n4f5a6f7e3b3f