Embedding Models
Benchmarks
⽇本語埋め込みモデル評価ベンチマークの構築
MIRACL: Multilingual Information Retrieval Across a Continuum of Languages
MTEB benchmark
レポ
論文
メモ
RetrievalとclusteringはEnglish-only (付録B.3)
Multilingual-E5
概要
論文
モデル
解説
注意点
IRなどクエリと文書が非対称な用途で使用する場合は、接頭辞にquery:とpassage:をつける
Cross-language information retrieval