Question 1

LiveCodeBench (汚染耐性コードベンチ)とは何ですか？

Accepted Answer

LiveCodeBenchとは、LeetCodeなどの競技プログラミングサイトから継続的に新問題を収集し、学習データ汚染を排除した条件でLLMのコーディング能力を客観評価するベンチマークのこと。 LiveCodeBenchは2024年にMITらの研究チームが発表したコードLLM評価フレームワーク。HumanEvalやMBPPといった従来ベンチマークは問題が固定されており、モデルの学習データに含まれている（汚染）可能性が高く、スコアが実力を過大評価しやすい欠点があった。LiveCodeBenchはLeetCode・AtCoder・CodeForcesから継続的に新問題を取得し、モデルのカット

Question 2

LiveCodeBench (汚染耐性コードベンチ)の使い方や活用例を教えてください

Accepted Answer

代表的な活用例は次のとおりです。GPT-4o・Claude 3.7・Gemini 2.5のLiveCodeBenchスコアを比較し、汚染排除後の真のコーディング性能ランキングを確認したい。 / コーディングAI選定時にLiveCodeBenchのカテゴリ別スコア（補完・バグ修正・アルゴリズム）で絞り込む手順を教えて。詳細な解説はLiveCodeBench (汚染耐性コードベンチ)の詳細ページをご覧ください。

Question 3

LiveCodeBench (汚染耐性コードベンチ)とLLM (大規模言語モデル)の違いは何ですか？

Accepted Answer

LiveCodeBench (汚染耐性コードベンチ)とLLM (大規模言語モデル)はAI用語として関連していますが、役割や使用場面が異なります。LiveCodeBench (汚染耐性コードベンチ)はLiveCodeBenchとは、LeetCodeなどの競技プログラミングサイトから継続的に新問題を収集し、学習データ汚染を排除した条件でLLMのコーディング能力を客観評価するベンチマークのこと。詳しくは関連用語の解説ページをご参照ください。

LiveCodeBench (汚染耐性コードベンチ)

定義

LiveCodeBench (汚染耐性コードベンチ)とは — 詳しく解説

LiveCodeBench (汚染耐性コードベンチ)の使用例

LiveCodeBench (汚染耐性コードベンチ)に関連するAIツール

関連用語

「評価指標」の他の用語

AI用語辞典をすべて見てみませんか