Pinecone
「Pinecone」は、シンプルなAPIを提供するフルマネージドなベクトルデータベースです。
高性能なベクトル検索アプリケーションを簡単に構築することができます。
Pinecone社 数十億のベクトルを10msで検索可能なほどの、処理精度の高さ Pineconeに出てくる概念
組織・プロジェクト管理
Organization
OrganizationにProjectやメンバーが紐づき、Organization単位で課金などの管理を行う
Project
Project単位でIndexを管理する。
APIキーもProject単位で発行される。
Projectの単位で、利用する環境(クラウドプロバイダーやリージョン)が設定される
index管理
Pod
PodはIndexを管理するハードウェアの単位
各インデックスは、1つまたは複数のポッド上で実行される
PodにはTypeとSizeがある。
Type:
ストレージ効率重視のs1,
パフォーマンス効率重視のp1, p2があります。
(Typeはindex作成後には変えられない)
Size:
x1、x2、x4、x8の4つのポッドサイズをサポートしています。
容量は、Type × Size の組み合わせで決まります。
Index
Indexはベクトルデータを管理する単位。
Indexには、ベクトルの次元数、ベクトルの類似性検索に使用するMetric(コサイン類似度、ユークリッド距離、など)などが設定出来る。
Collection
CollectionはIndexのある時点のバックアップデータ
データ移行のためにも使用できる。
データ管理
Namespace
Index内のVectorをNamespaceごとに分けて管理することができる。
Vectorは必ず1つのNamespaceに属しており、デフォルトは空文字。
queryを実行する時にNamespaceで絞り込むこともできる。
Metadata
Vectorに付随するメタ情報。
String, Number, Booleanなどがサポートされている。
queryを実行する時にMetadataでフィルタリングすることで、Vectorを効率よく検索することができる。
Pinecone
スケーラブルなベクトルデータベースで、高速な類似性検索を可能にします。
クラウドベースで提供されており、APIを通じて簡単にアクセスできます。