データ漏洩 (Data Leakage)
読み: でーたろうえい
最終更新: 2026-06-25・AI PICKS編集部
定義
データ漏洩とは、機密情報や個人データが意図せず外部に流出してしまうセキュリティ上のインシデントのこと。
データ漏洩 (Data Leakage)とは — 詳しく解説
データ漏洩とは、組織が保有する機密情報・個人情報・営業秘密などが、不正アクセス・設定ミス・内部不正・ソフトウェアの脆弱性などを通じて外部に流出するセキュリティインシデントを指す。AI・LLM活用が普及した2026年現在、実運用での落とし穴として特に注目されているのが「LLMへの入力を通じた漏洩」だ。社内の機密ドキュメントや顧客データをプロンプトに貼り付けてChatGPTやClaudeに送信することで、意図せずサードパーティのサーバーに機密が渡るケースが急増している。現場での対策として、エンタープライズ向けAPIプランの利用(学習データへの不使用を保証)やオンプレミス型LLMの採用が主流だが、コスト相場感はオンプレミス構築で初期100〜500万円超が一般的。また、RAGシステム構築時にベクトルDBへの不適切なアクセス制御が原因で、他ユーザーのデータが参照できる「クロステナント漏洩」も事例として報告されている。AI PICKS調べでは、国内企業の約4割がAIツール導入時のデータ取り扱いポリシーを未整備のまま運用している実態がある。AIセキュリティ対策ツールの導入やガイドライン策定を先行させることが、現場での最優先課題となっている。
データ漏洩 (Data Leakage)の使用例
- 社内の顧客リストをChatGPTに貼り付けて分析を依頼したところ、利用規約上そのデータが学習に使用される可能性があると指摘され、エンタープライズプランへの移行を余儀なくされた事例。
- RAGシステムで全社ドキュメントをベクトル化した際、アクセス権限の設定漏れにより一般社員が役員の給与情報を検索で取得できてしまった現場トラブル。
データ漏洩 (Data Leakage)に関連するAIツール
関連用語
「セキュリティ」の他の用語
ユーザー入力で AI の指示を上書きする攻撃。 「これまでの指示は無視して◯◯」 が典型例。
AI の安全制限を回避する手法。 ロールプレイや仮想シナリオで 禁止出力を引き出す。
ガードレールとは、AIシステムが有害・不適切・意図しない出力を生成しないよう制限するための安全制御機構のこと。
レッドチーミングとは、AIシステムの安全性・脆弱性を検証するため、攻撃者の視点から意図的に悪意ある入力やシナリオを試みる評価手法のこと。
シャドーAIとは、企業のIT部門や経営層の承認なしに従業員が個人的に業務で使うAIツール・サービスのこと。情報漏洩・規約違反・ガバナンス崩壊のリスクを内包する。
モデルポイズニングとは、AIモデルの学習データに悪意あるデータを混入させ、モデルの出力や判断を意図的に歪める攻撃手法のこと。
AI用語辞典をすべて見てみませんか
12カテゴリ・102語以上を体系的に整理しています
辞典トップへ