ベクトル検索
エンベディング
によって
数値ベクトル
に変換されたデータ同士を比較し、意味的に近い情報を探し出す検索手法
データ同士の距離や類似度を計算し、意味的に近いものから順に結果を取得
一般的には
コサイン類似度
などの指標を用いてベクトルの近さを測る
扱うデータ量が多い場合、すべてを正確に比較すると処理負荷が高くなるため、
近似近傍探索
(
ANN
) と呼ばれる手法を用いて、意味的に近そうな候補を高速に絞り込む
参考文献
図解まるわかり AI エージェントのしくみ