LLMサービスにおけるデータガバナンスとプライバシー保護:個人・法人利用の構造的比較分析
Gemini Deep Research.icon2026-03-05
生成AI時代におけるデータ主権のパラダイムシフトとガバナンスの要諦
従来のSaaSでは、データの機密性保持が標準的な前提であったが、生成AIの文脈では「デフォルトでの学習利用」という新たな常識が個人向けサービスを中心に定着しつつある。一方で、法人向けサービスにおいては、企業が求める厳格なコンプライアンス基準と機密保持義務を満たすため、データの学習除外やアクセスコントロールの強化が図られている。本報告書では、主要なLLMプロバイダーであるOpenAI、Anthropic、Google、Microsoft、そしてPerplexityの各サービスについて、データがどのように学習に利用され、どのような条件下で人間によるレビューが行われるのかを詳細に調査し、その構造的な違いを解明する。
OpenAI:ChatGPTとAPIプラットフォームにおける多層的ガバナンス
OpenAIは、生成AIの普及を牽引するリーダーとして、最も詳細かつ段階的なプライバシーポリシーを展開している。同社のデータ取り扱い方針は、個人ユーザーを対象とした「ChatGPT」の各プランと、開発者や企業を対象とした「APIプラットフォーム」および「ChatGPT Enterprise」の間で明確に線引きされている。
個人向けChatGPTにおける学習とレビューのメカニズム
ChatGPTの無料版、および有料サブスクリプションであるPlusやProの個人アカウントにおいて、デフォルトの設定ではユーザーの入力内容(プロンプト)および生成された回答(アウトプット)は、モデルの性能向上のための学習に利用される可能性がある 1。これには、テキストのみならず、アップロードされたファイル、画像、さらには音声データも含まれる 2。OpenAIは、モデルがより正確になり、ユーザー固有の問題を解決しやすくなることを学習の正当性として挙げている 1。
人間によるレビューについても、個人向けサービスでは一定の範囲で許容されている。OpenAIの限定的な権限を持つ担当者や、守秘義務を負った第三者の受託業者が、悪用の調査、セキュリティインシデントの対応、またはユーザーからのサポート依頼への対応のために、コンテンツにアクセスする場合がある 2。また、ユーザーが回答に対して「高評価」や「低評価」のフィードバックを提供した場合、そのフィードバックに関連する会話全体が、モデルの改善や人間による分析の対象となる可能性が高い 1。
しかし、個人ユーザーにはオプトアウトの手段が提供されている。設定画面から「モデルの改善(Chat History & Training)」をオフにすることで、以降の会話が学習に利用されることを防ぐことができる 1。さらに、一時的なチャット(Temporary Chat)機能を使用した場合、その会話は履歴に残らず、メモリも作成されず、学習にも利用されない 1。ただし、オプトアウトした場合でも、悪用監視のために最大30日間はデータがシステムに保持される点には注意が必要である 3。
法人向けサービスおよびAPIの堅牢な保護
対照的に、ChatGPT Enterprise、ChatGPT Business、ChatGPT Edu、およびAPIプラットフォーム(標準ティア)では、デフォルトでユーザーデータがモデルの学習に利用されることはない 1。これは、企業が独自に生成AIを統合する際、あるいは社内業務に導入する際の最大の障壁となる「機密漏洩リスク」を排除するための標準的な仕様である 6。組織が明示的にオプトイン(例えばPlaygroundでのフィードバック提供など)しない限り、入力データはOpenAIの基盤モデルに取り込まれることはない 1。
API利用における人間によるレビューは、主に「悪用監視(Abuse Monitoring)」の目的で行われる。OpenAIは、ポリシー違反や安全性の確認のために、APIの入出力を最大30日間保持し、必要に応じて人間が確認できる体制を整えている 4。ただし、高度な機密性が要求される特定のユースケースを持つ企業は、営業チームを通じて「ゼロデータ保持(Zero Data Retention: ZDR)」をリクエストすることが可能である 4。
OpenAI APIにおけるエンドポイント別のZDR適格性
OpenAIは、特定のエンドポイントにおいてZDRの適用を認めているが、すべての機能が対象となるわけではない。以下の表は、主要なAPIエンドポイントのデータ保持ポリシーをまとめたものである。
table:_
エンドポイント 学習利用 標準の悪用監視保持期間 ZDR適格性 特記事項
/v1/chat/completions なし 30日間 適格 8 標準的なチャット機能
/v1/assistants なし 30日間 不適格 8 状態保持が必要なため
/v1/embeddings なし 30日間 適格 8 ベクトル変換
/v1/audio/transcriptions なし なし 適格 8 音声書き起こし
/v1/fine_tuning/jobs なし 30日間 不適格 8 アーティファクト保存のため
/v1/moderations なし なし 適格 8 安全性チェック
ZDRが承認されたエンドポイントでは、データはメモリ内でのみ処理され、ディスクへの保存や人間によるレビュー、ログへの記録が完全に排除される 7。これは金融、医療、法的文書の処理など、極めて高い機密性が要求される分野において決定的な重要性を持つ。
アジアにおけるデータレジデンシの拡充
OpenAIは、特に規制の厳しい地域での利用を促進するため、データレジデンシ・オプションを拡大している。2025年11月の更新により、日本、インド、シンガポール、韓国において、ChatGPT Enterprise、ChatGPT Edu、およびAPIプラットフォームの顧客は、データを「静止状態(at-rest)」で国内に保存することを選択できるようになった 5。これにより、各国のデータ主権要件やローカルなコンプライアンス基準(日本の個人情報保護法など)への対応が強化されている 5。
Anthropic:憲法的AIと商用利用の厳格な分離
Anthropicは、安全性を最優先する「憲法的AI(Constitutional AI)」を掲げており、そのデータガバナンスも非常に体系化されている。特に2025年以降のポリシー更新により、個人向けサービスと法人向けサービスの差がより鮮明になった。
消費者向けプランにおけるデータ収集と長期保持の導入
Claudeの無料版、Pro、Maxといった消費者向けプランにおいて、デフォルトの設定はデータの学習利用が「オン」になっている 9。注目すべきは、2025年後半の規約更新により、学習利用に同意しているユーザーのデータ保持期間が、従来の30日間から最大5年間へと大幅に延長された点である 9。これは、長期的なモデルの進化においてユーザーのコンテキストをより深く理解させるための措置とされるが、法的リスクやデータプライバシーの観点からは大きな懸念材料となっている。
人間によるレビューについては、主に利用規約(Usage Policy)への違反が疑われる場合にトリガーされる。安全システムによってフラグが立てられた会話は、Anthropicのセーフティチームや特定の受託業者によって分析され、モデルの検出精度の向上に役立てられる 9。ユーザーがフィードバック(親指アップ/ダウン)を送った場合も、そのデータは人間によるレビューと学習の対象となる 11。一方で、学習への利用をオプトアウトした場合、保持期間は標準の30日間に維持される 10。
商用ターム(Claude for Work / API)による絶対的な隔離
Anthropicの商用利用規約(Commercial Terms of Service)が適用されるClaude for Work(TeamおよびEnterpriseプラン)やAPIサービスでは、例外なくユーザーデータの学習利用が禁止されている 9。この規約では、データの所有権が明確に顧客に帰属することが謳われており、機密保持義務も強化されている 9。
Anthropicにおけるプラン別のデータ取り扱い比較
table:_
項目 消費者プラン (Free/Pro/Max) 商用プラン (Team/Enterprise/API)
デフォルトの学習利用 あり(オプトアウト可) 9 なし(原則禁止) 9
データ保持期間 30日間(学習オフ)〜5年間(学習オン) 10 必要最小限(ZDRオプションあり) 9
人間によるレビュー 安全フラグ時、フィードバック時に発生 11 原則なし(ZDR構成時) 12
主な適用規約 Consumer Terms of Service 9 Commercial Terms of Service 9
API利用者向けには、「ゼロデータ保持(ZDR)」オプションが提供されている 12。ZDRが有効な場合、プロンプトと回答はリアルタイムで処理され、Anthropic側に永続的な痕跡を残さない。ただし、法律で義務付けられている場合や、深刻な規約違反が検出された場合には、最大2年間データが保持される例外条項が存在する 12。
Claude Codeとエージェントのガバナンス
開発者向けツールである「Claude Code」においても、ZDRの設定が可能である 12。ZDRが有効な組織では、ターミナルからのプロンプトやモデルの応答はAnthropic側に保存されず、管理者はユーザーごとのコスト制御や監査ログの取得といったエンタープライズ機能を利用できる 12。ただし、フィードバック送信機能などの一部の機能は、サーバー側へのデータ保存を必要とするため、ZDR環境下では自動的に無効化される 12。
Google Gemini:ワークスペースへの統合とエンタープライズ保護の深層
Googleは、個人向けのGeminiアプリと、Google WorkspaceやGoogle Cloud (Vertex AI)に組み込まれたAI機能の間で、異なるプライバシーレイヤーを設けている。
個人向けGeminiにおける「人間によるレビュー」の普遍性と長期保持
個人向けのGemini(旧Bard)では、ユーザーの操作(プロンプト、生成結果、フィードバック)はGoogleのサービス改善やモデル訓練に利用される 14。Googleのポリシーで特徴的なのは、「人間によるレビュー」の役割が非常に明確に定義されている点である。Googleは、品質評価やモデルの微調整のために、トレーニングされたレビュアー(第三者のサービスプロバイダーを含む)が一部の会話データを閲覧することを公言している 14。
このレビュープロセスでは、プライバシー保護のためにデータからGoogleアカウント情報が切り離される(非識別化)が、会話の内容そのものに含まれる個人情報は削除されないため、Googleはユーザーに対して「レビューされたくない機密情報や個人情報を入力しないこと」を強く推奨している 14。人間によってレビューされたデータは、ユーザーがGeminiアプリのアクティビティを削除したとしても、最大3年間保持される 3。
WorkspaceおよびVertex AI:ビジネスデータの非学習原則
Google Workspace for Business、Education、またはPublic Sectorの顧客がGemini機能を利用する場合、そのデータガバナンスはGoogle Cloudの標準的なデータ処理補足条項(CDPA)に従う 15。これにより、ユーザーのインタラクションは組織内に留まり、Googleがドメイン外のモデル訓練にデータを利用することはない 15。
Google Geminiにおける「アクティビティ保存(Keep Activity)」の設定
個人ユーザーが管理できる「Keep Activity」設定の状態によって、データの扱いは以下のように変化する。
table:_
設定状態 データの保存と利用 安全性のための短期保持 人間によるレビュー
オン (ON) 履歴に保存、学習に利用される 14 継続的 一部のサンプルが対象 14
オフ (OFF) 履歴に保存されない、学習に利用されない 14 最大72時間 14 原則なし(安全確保目的を除く)
アクティビティ設定をオフにしても、安全性の確保と応答処理のために最大72時間はデータが保持される点に留意が必要である 14。
Vertex AI:エンタープライズ・グレードのガバナンス
Vertex AIにおいては、さらに強固なガバナンスが提供される。デフォルトで、Googleは顧客がVertex AIに送信したデータをモデルの訓練や改善に使用しないことを契約で保証している 17。
人間によるレビューについても、企業向けプランでは標準で無効化されており、管理者は「データロギング」の設定を完全にオフにすることで、ゼロデータ保持を実現できる 18。ただし、「Google検索によるグラウンディング(Grounding with Google Search)」などの特定の機能を使用する場合、検索精度の向上のために最大30日間データが保持される例外がある 18。
Microsoft Copilot:エンタープライズ・データ・プロテクション(EDP)の全貌
Microsoftは、OpenAIとの提携に基づきつつも、自社のAzureインフラを基盤とした独自のデータ保護階層を構築している。
個人向けCopilotの柔軟性とデフォルト設定
Windowsやブラウザ経由で利用される個人向けのCopilotでは、会話データはサービス改善やモデルの訓練に利用される可能性がある 20。ただし、Microsoftはユーザーに対して強力なコントロール権を提供しており、プライバシー設定からパーナライゼーションのオフや、モデル訓練への利用のオプトアウトをいつでも行うことができる 20。
注目すべきは、ユーザーがアップロードした「ファイル」(ドキュメントの要約依頼など)については、プライバシー設定に関わらず、モデルの訓練には一切使用されないと明記されている点である 20。また、「Copilot Vision」などの視覚機能を使用する際、Microsoftは顔や手などのバイオメトリックデータの処理についてユーザーの明示的な同意を求める 20。
Microsoft 365 CopilotとAzure OpenAIのビジネス保護
企業向けのMicrosoft 365 Copilot(商用ライセンス)では、エンタープライズ・データ・プロテクション(EDP)が適用される 22。この環境下では、プロンプト、回答、およびMicrosoft Graph経由でアクセスされる組織内データ(メール、ドキュメント、カレンダーなど)は、基盤となるLLMの訓練に決して使用されない 22。
人間によるレビューについても、M365 CopilotはAzure OpenAIの「悪用監視(人間によるレビューを含む)」をデフォルトでオプトアウトしている 22。これにより、組織のデータがMicrosoftの従業員や外部業者の目に触れるリスクは極めて低い。Azure OpenAIを直接利用する企業顧客も、限定アクセスプログラムへの申請を通じて、管理された「ゼロデータ保持(ZDR)」の設定を行うことが可能である 24。
Perplexity AI:検索エンジン型AIのデータハンドリング
Perplexity AIは、検索と生成を組み合わせたユニークなサービスだが、そのデータポリシーも他のプロバイダーに準じている。
個人ユーザーとエンタープライズの対比
Perplexityの無料版およびPro版の個人ユーザーについては、「AIデータ保持(AI Data Retention)」がデフォルトで有効になっており、検索クエリや使用データがモデルの訓練に利用される 25。ユーザーはアカウント設定からこれをオフにできるが、オプトアウト前に収集されたデータは削除できない 25。
一方で、Perplexity Enterprise(Enterprise ProおよびEnterprise Max)では、データがモデルの訓練に利用されることは一切ない 25。
Perplexityにおけるプラン別の制限とプライバシー
table:_
プラン 学習利用 人間によるレビュー ファイルアップロード制限 特徴
Free あり あり 制限あり 27 基本的な検索のみ
Pro あり(オフ可) あり 50ファイル/Space 28 高度なモデルへのアクセス
Enterprise Pro なし なし 15,000ファイル 28 チームコラボレーション
Enterprise Max なし なし 10,000ファイル/ユーザー 27 最高レベルのセキュリティ
PerplexityはOpenAIやAnthropicなどのサードパーティモデルを利用しているが、これらのプロバイダーとの間で、エンタープライズ顧客のデータについては「ゼロデータ保持・ゼロデータ訓練」の厳格な合意を交わしている 25。
主要LLMサービス比較総合一覧表
以下の表は、主要なLLMサービスの個人向けおよび法人向けプランにおけるデータ取り扱いの詳細を網羅的にまとめたものである。
table:_
サービスプロバイダー プランカテゴリ モデル学習への利用 学習のオプトアウト 人間によるレビュー ZDRの可否
OpenAI 個人 (Free/Plus) デフォルトあり 1 可能(履歴オフ) あり(安全性・サポート) 2 否(Temporary Chatのみ)
法人 (Ent/API) 原則なし 1 不要(標準で除外) 原則なし(ZDR時) 可(要申請) 4
Anthropic 個人 (Free/Pro) デフォルトあり 9 可能(設定でオフ) あり(安全違反時) 11 否
法人 (Ent/API) 原則なし 10 不要(標準で除外) 原則なし(ZDR時) 可(要申請) 12
Google 個人 (Gemini App) あり 14 可能(アクティビティオフ) あり(3年間保持) 14 否
法人 (Workspace/Vertex) なし 15 不要(標準で除外) なし(組織内管理) 可(設定変更) 19
Microsoft 個人 (Copilot) あり 20 可能(プライバシー設定) あり(安全性・診断) 20 否
法人 (M365/Azure) なし 22 不要(標準で除外) なし(標準で除外) 22 可(限定アクセス) 24
Perplexity 個人 (Free/Pro) デフォルトあり 25 可能(設定でオフ) あり(安全性・規約遵守) 否
法人 (Enterprise) なし 25 不要(標準で除外) なし(隔離環境) 可(標準合意) 26
技術的深層分析:学習ループと安全性監視のトレードオフ
データの学習利用と人間によるレビューは、AIサービスの質を維持するために不可欠なプロセスであるが、その実施には高度なトレードオフが伴う。ここでは、それらのメカニズムの背景にある技術的な力学を考察する。
人間のフィードバックによる強化学習(RLHF)と報酬モデル
多くのLLMが「より人間らしい」回答を実現できているのは、RLHF(Reinforcement Learning from Human Feedback)という手法に負うところが大きい 29。このプロセスでは、人間(AIトレーナーやクラウドワーカー、あるいは一般ユーザーのフィードバック)がモデルの生成した複数の回答を比較・評価し、どれがより適切かをランク付けする 29。
個人向けサービスで「デフォルト学習」が採用されているのは、このRLHFのための膨大な「比較データ」を安価に収集するためである。ユーザーが提供する「高評価/低評価」のクリック一つが、次世代モデルの報酬モデルを訓練するための重要なラベルとなる 29。このデータ収集により、モデルは単に次の単語を予測するだけでなく、ユーザーの暗黙的な好み(簡潔さ、礼儀正しさ、事実の正確性など)を学習する 29。一方で、このプロセスには、特定の価値観へのバイアスや、不適切なコンテンツの混入というリスクも伴うため、提供側は厳格なガイドライン(例えばAnthropicの「憲法」など)を設けて制御を試みている 32。
安全性監視における人間によるレビューの必然性
「人間によるレビュー」は、単なるモデル訓練のためだけではなく、サービスの健全性を守るための「最後の防衛線」として機能している。自動化されたフィルターは、有害なプロンプトの多くを遮断できるが、文脈に依存する巧妙なバイパスや、高度な悪意を完全に検知することは難しい 33。
そのため、各プロバイダーは、安全システムによってフラグが立てられた「疑わしい会話」については、人間が内容を確認し、ポリシーの適用が正しいかを判断するプロセスを維持している 2。法人向けサービスで人間によるレビューが制限されることは、企業秘密の保護には寄与するが、同時にその企業アカウントがAIを悪用している場合、プロバイダー側がそれを検知する能力を弱める可能性もある 7。このジレンマを解決するため、多くのプロバイダーは、レビューを制限する代わりに、企業側に「責任ある利用(Shared Responsibility)」を強く求める契約スキームを採用している 8。
結論と戦略的提言
本調査の結果、LLMサービスにおけるデータの扱いは、初期の「一律学習」フェーズから、利用者のニーズと法的要件に応じた「機能的な隔離」フェーズへと進化していることが明らかになった。OpenAI、Anthropic、Google、Microsoft、Perplexityのいずれも、法人向けには強力な非学習・非レビューの保証を提供しており、企業が生成AIを導入するための技術的・契約的なハードルは大幅に下がっている。
しかし、その保護は自動的に得られるものではなく、適切なプランの選択、適切な設定(ZDRの申請やアクティビティのオフ)の有効化、そして組織内でのガバナンスの徹底というユーザー側の能動的なアクションがあって初めて成立する。組織は、機密情報を扱う場合は商用タームに基づくエンタープライズ・ライセンスまたはAPI利用へと移行すべきである。また、個人レベルでは、オプトアウト設定をしていても、安全性監視や不具合調査の目的で人間がデータを確認する可能性は常にゼロではないことを認識し、極めて繊細な個人情報の入力は避けるという基本的なリテラシーの維持が求められる。
引用文献
1. How your data is used to improve model performance | OpenAI Help ..., 3月 5, 2026にアクセス、
2. Data Usage for Consumer Services FAQ | OpenAI Help Center, 3月 5, 2026にアクセス、
3. Privacy Policy Evaluations - Perplexity, 3月 5, 2026にアクセス、
4. Enterprise privacy at OpenAI, 3月 5, 2026にアクセス、
5. Introducing data residency in Asia - OpenAI, 3月 5, 2026にアクセス、
6. OpenAI's Usage and Privacy Policies - Chat GPT vs. API - Aqua Data Studio, 3月 5, 2026にアクセス、
7. OpenAI's Zero Data Retention Policy | by J Kes - Medium, 3月 5, 2026にアクセス、
8. Data controls in the OpenAI platform, 3月 5, 2026にアクセス、
9. Anthropic's Claude AI Updates - Impact on Privacy & Confidentiality - AMST Legal, 3月 5, 2026にアクセス、
10. Simplified Version of Claude's Consumer Terms of Service by Cluade-Opus-4.6 and Consumers Are On Losing side : r/ClaudeAI - Reddit, 3月 5, 2026にアクセス、
11. How Do You Use Personal Data in Model Training? | Anthropic ..., 3月 5, 2026にアクセス、
12. Zero data retention - Claude Code Docs, 3月 5, 2026にアクセス、
13. Zero Data Retention (ZDR) - Claude API Docs, 3月 5, 2026にアクセス、
14. Gemini Apps Privacy Hub - Gemini Apps Help - Google Help, 3月 5, 2026にアクセス、
15. Generative AI in Google Workspace Privacy Hub, 3月 5, 2026にアクセス、
16. Generative AI Security, Compliance and Privacy | Google Workspace, 3月 5, 2026にアクセス、
17. Google AI Studio vs Gemini vs Vertex AI: Which Platform Do You Need? - Hoerr Solutions, 3月 5, 2026にアクセス、
18. google cloud platform - User data prompt security in GCP - Stack Overflow, 3月 5, 2026にアクセス、
19. Vertex AI and zero data retention - Google Cloud Documentation, 3月 5, 2026にアクセス、
20. Privacy FAQ for Microsoft Copilot - Microsoft Support, 3月 5, 2026にアクセス、
21. Microsoft Copilot privacy controls, 3月 5, 2026にアクセス、
22. Data, Privacy, and Security for Microsoft 365 Copilot, 3月 5, 2026にアクセス、
23. Data protection when using Microsoft 365 Copilot Chat for work or school, 3月 5, 2026にアクセス、
24. How can I get a zero data retention agreement so I can use Azure OpenAI Service within my platform? - Microsoft Learn, 3月 5, 2026にアクセス、
25. Data Collection at Perplexity | Perplexity Help Center, 3月 5, 2026にアクセス、
26. What is Enterprise Pro? | Perplexity Help Center, 3月 5, 2026にアクセス、
27. Which Perplexity Subscription Plan is right for you?, 3月 5, 2026にアクセス、
28. Perplexity Pricing in 2026 for Individuals, Orgs & Developers - Finout, 3月 5, 2026にアクセス、
29. Reinforcement Learning From Human Feedback (RLHF) For LLMs - Neptune.ai, 3月 5, 2026にアクセス、
30. RLHF Pipeline for Clinical LLMs: An Implementation Guide - IntuitionLabs.ai, 3月 5, 2026にアクセス、
31. Human Feedback in LLM Validation Workflows - Latitude.so, 3月 5, 2026にアクセス、
32. How do you use personal data in model training? - Anthropic Privacy Center, 3月 5, 2026にアクセス、
33. Building safeguards for Claude - Anthropic, 3月 5, 2026にアクセス、
34. AI Data Classification: What Is Safe for ChatGPT & Copilot | IntuitionLabs, 3月 5, 2026にアクセス、
35. Usage policies - OpenAI, 3月 5, 2026にアクセス、