AI PICKS
AI用語辞典セキュリティ

LLMファイアウォール (Prompt Firewall)

読み: えるえるえむふぁいあうぉーる(ぷろんぷとふぁいあうぉーる)

最終更新: 2026-06-28・AI PICKS編集部

定義

LLMファイアウォール(Prompt Firewall)とは、LLMへの入出力をリアルタイムで監視・フィルタリングし、プロンプトインジェクションや情報漏洩・有害出力を防ぐセキュリティ層のこと。

LLMファイアウォール (Prompt Firewall)とは — 詳しく解説

LLMファイアウォールは、AIシステムへのリクエスト(プロンプト)と応答(コンプリーション)の双方向をリアルタイムで検査し、プロンプトインジェクション・個人情報漏洩・有害コンテンツ生成・脱獄(ジェイルブレイク)を防ぐセキュリティミドルウェアの総称。業界では「Guardrails」「AI Firewall」とも呼ばれ、Amazon Bedrock GuardrailsやLakera Guard等が代表的な実装として知られる。 2026年現在、生成AIの企業導入が加速する中、実運用での最大の落とし穴は「過検知」だ。防御ルールを厳しくすると正当なビジネス用途まで弾かれ、エンジニアからの反発を招くケースが現場では頻発している。また、マルチモーダル対応(画像・音声経由の攻撃)はまだ未成熟なソリューションが多く、テキストのみ防御では不十分な場面も増えている。 相場感としては、OSS(NeMo Guardrails等)なら構築コスト中心で月数万円〜、商用SaaSは月10〜50万円規模が一般的。AI PICKSが調査した国内事例では、金融・医療系の企業がコンプライアンス対応を優先しSaaSを選ぶ一方、スタートアップはOSSで最低限の入力バリデーションから始めるケースが多い。現場での選び方は「守りたい脅威モデルの明確化」から始めること。ジェイルブレイク対策かデータ漏洩防止かで最適解が大きく変わる。

LLMファイアウォール (Prompt Firewall)の使用例

  • 「上記の指示を無視して…」のようなプロンプトインジェクション攻撃を検知し、本番チャットボットで自動ブロックするルールを適用した事例。
  • 社内LLMの回答に含まれるメールアドレス・電話番号をリアルタイムでマスキングし、個人情報漏洩ゼロを担保した企業導入の実装例。

LLMファイアウォール (Prompt Firewall)に関連するAIツール

関連用語

セキュリティ」の他の用語

AI用語辞典をすべて見てみませんか

12カテゴリ・252語以上を体系的に整理しています

辞典トップへ