PIIマスキング (個人情報マスキング)
読み: ぴーあいあいますきんぐ (こじんじょうほうますきんぐ)
最終更新: 2026-06-27・AI PICKS編集部
定義
PIIマスキングとは、氏名・メールアドレス・電話番号などの個人識別情報(PII)をAIモデルやシステムが処理する前に隠蔽・置換し、プライバシー漏洩を防ぐ技術のこと。
PIIマスキング (個人情報マスキング)とは — 詳しく解説
PIIマスキングは、GDPR・個人情報保護法などの規制対応のため、データパイプラインやAIシステムに組み込まれる必須技術だ。手法は主に3種類——①静的マスキング(本番データを変換して開発・テスト環境へ流す)、②動的マスキング(クエリ実行時にリアルタイムで隠蔽)、③トークン化(元データを復元可能なトークンに置換)。 2026年現在、LLMへのデータ入力が普及したことで現場の課題が急増した。RAGシステムや社内AIエージェントに業務データを流す際、プロンプトの中に顧客の氏名・住所・クレジットカード番号が混入するリスクが深刻化している。実運用での最大の落とし穴は「マスキング粒度の誤設定」だ。過剰にマスクすると業務上必要な文脈も消えてモデルの精度が著しく低下し、逆に甘すぎると規制違反に直結する。 相場感ではオープンソースのPresidio(Microsoft製)が無料で使えるが、日本語対応には追加チューニングが必要でエンジニアコストが月15〜30万円程度かかる。商用SaaSは月額$500〜$3,000が目安。現場での選び方は「復元可能性」が分岐点で、分析・学習目的なら不可逆の匿名化、決済・医療など元データ参照が必要なケースは復元可能なトークン化を選ぶのが定石だ。
PIIマスキング (個人情報マスキング)の使用例
- カスタマーサポートのチャットログをLLMで要約する前に氏名・メールを自動マスクし、OpenAI等への個人情報流出を防ぐ典型的な活用例。
- 本番DBを開発環境にコピーする際、静的マスキングで住所・電話番号を仮データに置換してからエンジニアに渡し、GDPR違反リスクをゼロにする。
PIIマスキング (個人情報マスキング)に関連するAIツール
関連用語
「セキュリティ」の他の用語
ユーザー入力で AI の指示を上書きする攻撃。 「これまでの指示は無視して◯◯」 が典型例。
AI の安全制限を回避する手法。 ロールプレイや仮想シナリオで 禁止出力を引き出す。
ガードレールとは、AIシステムが有害・不適切・意図しない出力を生成しないよう制限するための安全制御機構のこと。
レッドチーミングとは、AIシステムの安全性・脆弱性を検証するため、攻撃者の視点から意図的に悪意ある入力やシナリオを試みる評価手法のこと。
シャドーAIとは、企業のIT部門や経営層の承認なしに従業員が個人的に業務で使うAIツール・サービスのこと。情報漏洩・規約違反・ガバナンス崩壊のリスクを内包する。
モデルポイズニングとは、AIモデルの学習データに悪意あるデータを混入させ、モデルの出力や判断を意図的に歪める攻撃手法のこと。
AI用語辞典をすべて見てみませんか
12カテゴリ・202語以上を体系的に整理しています
辞典トップへ