RAG
RAG(検索拡張生成:Retrieval-Augmented Generation)
RAGの種類整理ChatGPT.icon
1. 検索対象(データソース)
非構造テキストRAG
PDF / Markdown / HTML など
構造化データRAG
RDB / NoSQL / CSV(NL→SQL)
API / Tool RAG
外部API・社内APIの呼び出し結果を利用
2. 検索方法
キーワードRAG(Lexical)
BM25 / 転置インデックス
ベクトルRAG(Semantic)
embedding + 類似度検索
ハイブリッドRAG
キーワード + ベクトル
3. 検索戦略
Single-shot RAG
1回検索 → 1回生成
Multi-query RAG
クエリ分解して複数検索
Iterative / Re-query RAG
途中結果を見て再検索
Self-RAG / Reflection RAG
自己評価して再検索判断
4. コンテキスト構成
Stuffing RAG
検索結果をそのまま投入
Summarization RAG
検索結果を要約して投入
Evidence-based RAG
出典・根拠付きで投入
5. 運用形態
Static RAG
インデックス固定
Streaming / Fresh RAG
検索時に最新データ取得
6. 関連・注意点
RAG ≠ embedding
RAG ≠ ベクトルDB
AgentはRAGを内包することが多い