AI PICKS
AI用語辞典プロンプト技法

プロンプト圧縮 (Prompt Compression)

読み: ぷろんぷとあっしゅく

最終更新: 2026-06-29・AI PICKS編集部

定義

プロンプト圧縮とは、LLMに渡すプロンプトやコンテキストの意味を保ちながらトークン数を大幅に削減する技術のこと。

プロンプト圧縮 (Prompt Compression)とは — 詳しく解説

プロンプト圧縮は、LLMのコンテキストウィンドウ上限やAPIコスト制約を克服するための技術群を指す。代表的な手法には、MicrosoftのLLMLinguaによる意味損失最小化圧縮、RAGで取得したチャンクの要約統合、システムプロンプトの冗長削除などがある。2026年現在、超長コンテキストモデルが普及しつつも、プレミアムモデルの入力トークンコストは百万トークンあたり数百円〜数千円の相場感があり、長文ドキュメント処理では圧縮が依然コスト削減に直結する。現場での選び方は、品質重視ならLLMLingua系ライブラリ、速度重視なら要約モデルの前段配置、エージェント系なら記憶の選択的保持(Selective Context)が定番パターン。実運用での落とし穴は、圧縮率を上げすぎると固有名詞・数値・手順が欠落しハルシネーションが増加する点で、圧縮率70〜80%が品質と効率のバランス上限とされる。AI PICKS編集部では圧縮後の出力品質を必ず検証してから本番適用することを推奨している。

プロンプト圧縮 (Prompt Compression)の使用例

  • 2000トークンの長文仕様書をLLMLinguaで400トークンに圧縮し、GPT-4o APIコストを80%削減した導入事例。
  • RAGで取得した10チャンクをLLMで3つに要約圧縮してからClaudeに渡し、回答精度と速度を両立した実運用パターン。

プロンプト圧縮 (Prompt Compression)に関連するAIツール

関連用語

プロンプト技法」の他の用語

AI用語辞典をすべて見てみませんか

12カテゴリ・302語以上を体系的に整理しています

辞典トップへ