プロンプト圧縮 (Prompt Compression)
読み: ぷろんぷとあっしゅく
最終更新: 2026-06-29・AI PICKS編集部
定義
プロンプト圧縮とは、LLMに渡すプロンプトやコンテキストの意味を保ちながらトークン数を大幅に削減する技術のこと。
プロンプト圧縮 (Prompt Compression)とは — 詳しく解説
プロンプト圧縮は、LLMのコンテキストウィンドウ上限やAPIコスト制約を克服するための技術群を指す。代表的な手法には、MicrosoftのLLMLinguaによる意味損失最小化圧縮、RAGで取得したチャンクの要約統合、システムプロンプトの冗長削除などがある。2026年現在、超長コンテキストモデルが普及しつつも、プレミアムモデルの入力トークンコストは百万トークンあたり数百円〜数千円の相場感があり、長文ドキュメント処理では圧縮が依然コスト削減に直結する。現場での選び方は、品質重視ならLLMLingua系ライブラリ、速度重視なら要約モデルの前段配置、エージェント系なら記憶の選択的保持(Selective Context)が定番パターン。実運用での落とし穴は、圧縮率を上げすぎると固有名詞・数値・手順が欠落しハルシネーションが増加する点で、圧縮率70〜80%が品質と効率のバランス上限とされる。AI PICKS編集部では圧縮後の出力品質を必ず検証してから本番適用することを推奨している。
プロンプト圧縮 (Prompt Compression)の使用例
- 2000トークンの長文仕様書をLLMLinguaで400トークンに圧縮し、GPT-4o APIコストを80%削減した導入事例。
- RAGで取得した10チャンクをLLMで3つに要約圧縮してからClaudeに渡し、回答精度と速度を両立した実運用パターン。
プロンプト圧縮 (Prompt Compression)に関連するAIツール
関連用語
「プロンプト技法」の他の用語
AI への指示文。 役割 + タスク + 制約 + 文脈 の 4 要素を明示するのが基本。
AI への指示文を 設計する技術。 役割・タスク・制約・文脈 の 4 要素 + Few-shot などのテクニック。
AI に「お手本の例」を 3-5 件見せてから タスクを依頼する手法。 出力フォーマットが安定する。
AI に「ステップごとに考えてください」と促し、 複雑な推論精度を上げる手法。
例示なしで AI にタスクを依頼する方法。 最新モデルは Zero-shot 精度が大幅に向上した。
システムプロンプトとは、AIアシスタントの応答スタイル・役割・制約をあらかじめ設定する隠し命令文のこと。ユーザーの入力より先に処理され、会話全体のトーンと動作範囲を規定する。
AI用語辞典をすべて見てみませんか
12カテゴリ・302語以上を体系的に整理しています
辞典トップへ