AI PICKS
AI用語辞典セキュリティ

メンバーシップ推論攻撃 (Membership Inference)

読み: めんばーしっぷすいろんこうげき

最終更新: 2026-06-27・AI PICKS編集部

定義

メンバーシップ推論攻撃とは、あるデータがAIモデルの学習に使われたかどうかを外部から統計的に推定するプライバシー攻撃のこと。モデルの出力スコアの差異を観察することで個人情報漏洩につながる。

メンバーシップ推論攻撃 (Membership Inference)とは — 詳しく解説

メンバーシップ推論攻撃は、機械学習モデルへの入力に対する予測スコアや確率分布を観察することで、そのデータが学習セットに含まれていたかを判定するプライバシー攻撃手法。Shokri ら(2017年)により体系化され、過学習(オーバーフィッティング)したモデルほど成功率が高くなる。 2026年の実運用では、社内文書や医療記録でFine-tuningしたLLMへのAPI公開が急増し、現場での脅威度が急上昇している。「モデルを外部公開する=学習データの断片が推測可能になる」という認識はAI PICKSが調査した国内企業でも2026年時点でようやく標準化されてきた段階だ。競合他社がAPIにプローブを大量送信して学習元の機密情報を推定するシナリオは、金融・医療・法務領域で現実的なリスクとなっている。 対策の相場感としては、差分プライバシー(Differential Privacy)の実装工数が2〜4週間、モデル精度の1〜5%低下とのトレードオフが一般的。出力を上位kラベルのみに絞るAPI設計や、学習データのサニタイジングも標準的な防御層となる。GDPR・個人情報保護法対応が必須の領域では、この攻撃への対策が調達要件に明記されるケースが増えている。

メンバーシップ推論攻撃 (Membership Inference)の使用例

  • 医療AIが患者データで学習した場合、攻撃者がAPIに特定患者情報を入力して出力の自信度スコアを観察し、学習データへの含有を高精度で推定できる。
  • LLMの出力確率分布を比較することで、特定テキストが事前学習コーパスに含まれていたかを識別する研究が2024年以降急増し、実害事例も報告されている。

メンバーシップ推論攻撃 (Membership Inference)に関連するAIツール

関連用語

セキュリティ」の他の用語

AI用語辞典をすべて見てみませんか

12カテゴリ・202語以上を体系的に整理しています

辞典トップへ