RAG
RAG(Retrieval Augmented Generation)は、大規模言語モデル(LLM)によるテキスト生成に外部情報の検索を組み合わせることで、回答精度を向上させる技術
日本語では「検索拡張生成」や「取得拡張生成」
仕組み
1. 検索フェーズ:ユーザーの質問に関連する情報を外部データベースや文書から検索。
2. 生成フェーズ:検索結果とユーザーの質問を組み合わせたプロンプトをLLMに入力し、テキスト生成結果を取得
補足
検索フェーズで、質問文から1536次元のembeddingを算出し、vector検索で類似文書を検索
検索出来るように、事前にembedding算出して類似文書をVector Databaseに保存しておく
メリット
情報の最新性: 外部データベースの情報を更新することで、最新の情報を即座に反映できる
出力結果の信頼性: 外部情報の検索結果を利用するため、根拠が明確になり、回答の信頼性が高まる
ハルシネーションの抑制: 事実に基づかない情報生成を抑制する効果
活用例
FAQシステムやチャットボットでの利用
技術文書の自動生成
バーチャルアシスタントの応答生成