Question 1

レイテンシ (Latency)とは何ですか？

Accepted Answer

レイテンシとは、AIモデルにリクエストを送信してから最初のレスポンスが返るまでの応答時間のこと。 レイテンシは、AIシステムの体験品質を左右する最重要指標の一つ。一般的には「Time to First Token（TTFT）」と「Time to Last Token（TTLT）」の2軸で計測される。TTFTはストリーミング体験に直結し、ユーザーが「動いている」と感じるまでの時間を表す。

2026年の実運用では、モデルの賢さとレイテンシはトレードオフの関係にある。GPT-5やClaude Op

Question 2

レイテンシ (Latency)の使い方や活用例を教えてください

Accepted Answer

代表的な活用例は次のとおりです。音声AIで会話が不自然に感じる原因の多くはレイテンシ。TTFTを1秒以下に抑えることで体験が激変する。 / RAGシステム構築時はベクトル検索の処理時間もレイテンシに加算されるため、インデックス設計が重要になる。詳細な解説はレイテンシ (Latency)の詳細ページをご覧ください。

Question 3

レイテンシ (Latency)とLLM (大規模言語モデル)の違いは何ですか？

Accepted Answer

レイテンシ (Latency)とLLM (大規模言語モデル)はAI用語として関連していますが、役割や使用場面が異なります。レイテンシ (Latency)はレイテンシとは、AIモデルにリクエストを送信してから最初のレスポンスが返るまでの応答時間のこと。詳しくは関連用語の解説ページをご参照ください。

レイテンシ (Latency)

定義

レイテンシ (Latency)とは — 詳しく解説

レイテンシ (Latency)の使用例

レイテンシ (Latency)に関連するAIツール

関連用語

「評価指標」の他の用語

AI用語辞典をすべて見てみませんか