RAGとファインチューニングの違い

ファインチューニングでは、LLMが持っていない知識を、LLMに追加で学習させモデルを賢くするというアプローチ。

それに対しRAGは、LLMが知らない情報をベクトルストアにため込んでおいて、LLM単体ではなく、ベクトルストアとの合わせ技で最終的な回答を作れるようにしている。

https://scrapbox.io/files/657fae2a4fb0d9002301c990.png

ファインチューニングのようにLLMの再学習は必須ではない。

従って、学習用データを作る必要はないが、その代わりに、ベクトルストアを構築し、運用するという工数が発生する。