LLMを利用したRAG(Retrieval Augmented Generation)と著作権侵害
public.icon
LLMを利用したRAG(Retrieval Augmented Generation)と著作権侵害 (1) LLMを利用したRAG(Retrieval Augmented Generation)において、第三者の著作物をベクトルデーターベースとして蓄積したり、マッチングした既存情報をLLMへプロンプトとして入力する行為は原則として適法。
(2) ただし、LLMによる回答(AI生成物)に入力対象著作物の表現上の本質的特徴が含まれている場合は著作権侵害に該当。
[]
(3) 違法と適法の境目は「LLMによる回答(AI生成物)に入力対象著作物の表現上の本質的特徴が含まれているか否か」。もっとも、LLMを利用したRAGの場合には、LLMによる回答が入力対象著作物の表現上の本質的な特徴を含んだ回答になるケースは少ないのではないか。
(4) また、「入力対象著作物がウェブページ上の著作物の場合に、当該ウェブページのリンクだけを出力・回答する」「入力対象著作物が書籍の場合に、当該書籍の書誌情報及び頁番号だけ出力する」「LLMによる回答(AI生成物)に入力対象著作物の本質的特徴が含まれている場合」であっても、その利用が「軽微利用」にとどまっている場合」には適法。
第三者の著作物をベクトルデーターベースとして蓄積したり(上記図①)、マッチングした著作物をLLMへプロンプトとして入力する行為(上記図⑤⑥)は、いずれも「LLMによる回答生成」のための、入力プロンプトの解析行為(上記図⑦=情報解析)に必要と認められる行為ですから著作権法30条の4により原則として適法である