AI PICKS
AI用語辞典インフラ・学習

憲法AI (Constitutional AI)

読み: けんぽうえーあい

最終更新: 2026-06-29・AI PICKS編集部

定義

憲法AIとは、AIモデルに「守るべき原則リスト(憲法)」を与えて自己批判と修正を繰り返させ、安全かつ倫理的な応答を引き出す訓練手法のこと。

憲法AI (Constitutional AI)とは — 詳しく解説

Constitutional AI(憲法AI)はAnthropicが2022年に発表した安全技術で、AIモデルに「有害出力を避ける」「差別的表現を使わない」などの原則集(憲法)を与え、モデル自身に自己批判と改善を反復させる手法。従来のRLHF(人間フィードバック強化学習)では人間のラベラーが直接有害出力を評価する必要があったが、Constitutional AIではAI自身のフィードバック(RLAIF)が大部分を担うため、スケーラブルかつ低コストな訓練が可能となる。 2026年現在、最も有名な実装はAnthropicのClaudeシリーズ。実運用での最大の落とし穴は「憲法の言語化精度」で、原則の粒度が粗いと過剰な自己検閲や意図しない拒否が頻発する。現場ではドメイン専門家が原則をドラフトし、数百件の評価セットで定期的に検証するサイクルが業界標準となっている。 AI PICKSが把握した事例では、カスタマーサポートAIに「競合他社を否定しない」「返金ルール外で謝罪しない」などの社内憲法を設定し、ブランドポリシー遵守率を大幅改善した例が複数ある。2026年相場感では、自社モデルへのフル実装は月100万〜500万円規模だが、APIのシステムプロンプト設計で類似効果を低コストで得る現場も急増している。

憲法AI (Constitutional AI)の使用例

  • カスタマーサポートAIに「競合比較はしない」「個人情報を繰り返さない」などの社内憲法10か条を定義し、応答品質のバラつきを約30%削減した事例。
  • システムプロンプトに原則リストを埋め込む簡易Constitutional AI。本格的なRLAIF訓練なしでも応答の一貫性を確保できる低コスト手法として現場で普及中。

憲法AI (Constitutional AI)に関連するAIツール

関連用語

インフラ・学習」の他の用語

AI用語辞典をすべて見てみませんか

12カテゴリ・302語以上を体系的に整理しています

辞典トップへ