タスク単価 (Cost per Task)
読み: たすくたんか
最終更新: 2026-06-29・AI PICKS編集部
定義
タスク単価とは、AIが特定のタスクを1件完了するのにかかるコストの総額を指す評価指標のこと。
タスク単価 (Cost per Task)とは — 詳しく解説
タスク単価(Cost per Task)とは、AIシステムが1つのタスク(例:メール返信1件、コード1関数生成、サポートチケット1件解決)を完了するために消費するトークン・API費用・インフラ費用・人件費の合計を指す。単純なトークン消費量だけでなく、リトライ・バリデーション・人手確認のコストまで含めて算出するのが業界標準の考え方。 2026年の実運用での落とし穴として多いのが「プロンプト設計が甘いと1タスクあたりのトークン数が3〜5倍に膨らむ」ケース。特にRAGや複数エージェント構成では、検索コスト・オーケストレーションオーバーヘッドが見落とされがちだ。AI PICKSで現場ツールを比較する際は、公称スペックではなく実タスクベースのCost per Taskで横並び評価することを推奨している。 2026年の相場感としては、カスタマーサポート自動回答で1件あたり0.5〜3円、コード生成補助で1関数あたり1〜10円程度が目安。ツール選定時は「月間タスク数×単価」でROI試算を先に行い、精度と単価のトレードオフを現場判断で設定するのが実務の鉄則。
タスク単価 (Cost per Task)の使用例
- 月10万件のサポートチケットをAI自動回答に切り替えた場合、タスク単価1.5円なら月15万円のAPI費用で済む計算になる。
- RAG構成でのコード補完タスク:検索3回+生成1回で1タスク約8円。チーム50人×月200タスクで月8万円のコスト見積もりが可能。
タスク単価 (Cost per Task)に関連するAIツール
関連用語
「評価指標」の他の用語
Massive Multitask Language Understanding。 57 分野・1.5 万問の LLM 知識評価ベンチマーク。
OpenAI 発の Python コーディング能力ベンチマーク。 164 問の関数実装タスク。
ユーザー投票による LLM の人間評価ランキング。 Elo レーティングで モデルを順位付け。
ベンチマークとは、AIモデルの性能を標準化されたテスト課題で数値化し、異なるモデル間を公平に比較するための評価基準セットのこと。MMLUやHumanEval等、用途別に数十種類が存在する。
SWE-benchとはGitHubの実際のIssueをAIが自動修正できるかを測る、コーディングAI評価の業界標準ベンチマークのこと。
GPQAとは、生物・物理・化学の大学院レベルの難問でAIの推論力を測る評価ベンチマークのこと。Googleで検索しても解けない設計が特徴。
AI用語辞典をすべて見てみませんか
12カテゴリ・302語以上を体系的に整理しています
辞典トップへ