RAG - mtane0412

RAG

RAG（検索拡張生成：Retrieval-Augmented Generation）

RAGの種類整理ChatGPT.icon

1. 検索対象（データソース）

非構造テキストRAG

PDF / Markdown / HTML など

構造化データRAG

RDB / NoSQL / CSV（NL→SQL）

API / Tool RAG

外部API・社内APIの呼び出し結果を利用

2. 検索方法

キーワードRAG（Lexical）

BM25 / 転置インデックス

ベクトルRAG（Semantic）

embedding + 類似度検索

ハイブリッドRAG

キーワード + ベクトル

3. 検索戦略

Single-shot RAG

1回検索 → 1回生成

Multi-query RAG

クエリ分解して複数検索

Iterative / Re-query RAG

途中結果を見て再検索

Self-RAG / Reflection RAG

自己評価して再検索判断

4. コンテキスト構成

Stuffing RAG

検索結果をそのまま投入

Summarization RAG

検索結果を要約して投入

Evidence-based RAG

出典・根拠付きで投入

5. 運用形態

Static RAG

インデックス固定

Streaming / Fresh RAG

検索時に最新データ取得

6. 関連・注意点

RAG ≠ embedding

RAG ≠ ベクトルDB

AgentはRAGを内包することが多い