思考予算 (Thinking Budget)
読み: しこうよさん(しんきんぐばじぇっと)
最終更新: 2026-06-28・AI PICKS編集部
定義
思考予算とはLLMが最終回答を出力する前に使用できる内部推論トークン数の上限設定のこと。数値が大きいほど複雑な問題に強くなるが、APIコストも比例して増加する。
思考予算 (Thinking Budget)とは — 詳しく解説
思考予算(Thinking Budget)とは、Claude Extended ThinkingやOpenAI o1/o3シリーズなど推論強化型LLMが、最終回答を生成する前に行う内部的な「熟考」プロセスに割り当てるトークン数の上限設定のこと。この内部思考はユーザーには通常非表示だが、モデルの推論品質と出力コストの両方に直接影響する重要なパラメータだ。 2026年の実運用では、thinking budgetの調整が費用対効果を左右する最重要チューニングポイントになっている。Claude APIではbudget_tokensパラメータで上限を指定でき、現場での相場感としてシンプルなQAなら4,000〜8,000トークン、複雑なコード生成や多段階推論には16,000〜32,000トークンが目安。AI PICKSの検証でも、闇雲に上限を上げると同一タスクでコストが5〜10倍に膨らむケースが確認されており、タスク難易度に応じた動的切替が推奨される。落とし穴として「budgetを上げれば必ず精度が上がる」わけではなく、単純タスクでは過剰思考によって却って回り道な回答を生成するケースもある。エージェント構成では呼び出しごとに動的に調整する設計がベストプラクティスとなっている。
思考予算 (Thinking Budget)の使用例
- Claude APIでbudget_tokens=20000を設定し複雑な契約書レビューを依頼したところ、デフォルト比で精度が向上した一方、コストは約6倍になった実例。
- エージェント実装で「単純QAは4k・複数ツール呼び出しは24k」と動的切替にしたところ、品質を維持しながら月次APIコストを55%削減できた事例。
思考予算 (Thinking Budget)に関連するAIツール
関連用語
「LLM / 言語モデル」の他の用語
Artificial Intelligence の略。人間の知能をコンピュータで再現する技術全般を指す。
Large Language Model の略。 膨大なテキストで学習した文章生成 AI。 ChatGPT / Claude / Gemini が代表例。
AI がそれっぽい嘘をつく現象。 学習データに無い情報を推測で生成してしまう。
AI が一度に扱える文章の長さ。 トークン数で表現される (例: Claude Opus 4.7 は 1M トークン)。
AI が扱う文字のかたまり。 日本語は 1 文字 ≒ 1 トークン、 英語は単語 ≒ 1 トークン。 料金計算の単位でもある。
文章・画像・音声・動画 を新規に作り出す AI 技術。 ChatGPT 以降の AI ブームの主役。
AI用語辞典をすべて見てみませんか
12カテゴリ・252語以上を体系的に整理しています
辞典トップへ