Question 1

トークン毎秒 (スループット)とは何ですか？

Accepted Answer

トークン毎秒 (スループット) とは、LLM が1秒間に生成・処理できるトークン数を示す性能指標のこと。値が大きいほど応答が速く、リアルタイム用途や大量一括処理に向く。 トークン毎秒 (TPS: Tokens Per Second) は LLM の推論速度を定量化する重要指標で、「生成 TPS」 (出力速度) と「処理 TPS」 (入力処理速度) の2種類がある。業界標準では 20〜50 TPS 程度が「快適な応答感」の目安とされ、音声 AI やリアルタイムコード補完では 100 TPS 以上が事実上必要になる。

2026年時点の実運用では、クラウド API の

Question 2

トークン毎秒 (スループット)の使い方や活用例を教えてください

Accepted Answer

代表的な活用例は次のとおりです。音声 AI では TPS 100 以上を確保しないと会話が途切れ途切れになるため、API 選定時に混雑時の最低 TPS を必ず確認する。 / 月 1,000 万トークン超のバッチ処理では、専用スループット枠 (Provisioned Throughput) で TPS を固定しコスト安定を図る設計が定石。詳細な解説はトークン毎秒 (スループット)の詳細ページをご覧ください。

Question 3

トークン毎秒 (スループット)とトークンの違いは何ですか？

Accepted Answer

トークン毎秒 (スループット)とトークンはAI用語として関連していますが、役割や使用場面が異なります。トークン毎秒 (スループット)はトークン毎秒 (スループット) とは、LLM が1秒間に生成・処理できるトークン数を示す性能指標のこと。値が大きいほど応答が速く、リアルタイム用途や大量一括処理に向く。詳しくは関連用語の解説ページをご参照ください。

トークン毎秒 (スループット)

定義

トークン毎秒 (スループット)とは — 詳しく解説

トークン毎秒 (スループット)の使用例

トークン毎秒 (スループット)に関連するAIツール

関連用語

「評価指標」の他の用語

AI用語辞典をすべて見てみませんか