Question 1

pass@k (コード生成評価指標)とは何ですか？

Accepted Answer

pass@kとはコード生成AIが生成したk個のコードサンプルのうち、少なくとも1つが全ユニットテストを通過する確率を示す評価指標のこと。 pass@kは、コード生成AIの性能を測る代表的な評価指標。k個のコードサンプルを生成したとき、少なくとも1つが全ユニットテストを通過する確率として定義される。kが1の場合（pass@1）は「1発で正解できる確率」、kが10や100の場合は「何度か試せば通る確率」を表し、モデルの信頼性と生成の多様性を同時に評価できる。

2026年の実運用では、pass@1だけを評価軸にするのは危険という認識が現

Question 2

pass@k (コード生成評価指標)の使い方や活用例を教えてください

Accepted Answer

代表的な活用例は次のとおりです。HumanEval 164問でpass@1を計測したところGPT-4oは87%を達成。補完用途ではpass@5が実態に近い参考値として活用される事例が多い。 / 社内コード補完ツール選定でpass@10を比較評価。k倍のAPI費用を考慮し最終的にk=5で各モデルをベンチマークして導入モデルを決定した。詳細な解説はpass@k (コード生成評価指標)の詳細ページをご覧ください。

Question 3

pass@k (コード生成評価指標)とAI コーディングの違いは何ですか？

Accepted Answer

pass@k (コード生成評価指標)とAI コーディングはAI用語として関連していますが、役割や使用場面が異なります。pass@k (コード生成評価指標)はpass@kとはコード生成AIが生成したk個のコードサンプルのうち、少なくとも1つが全ユニットテストを通過する確率を示す評価指標のこと。詳しくは関連用語の解説ページをご参照ください。

pass@k (コード生成評価指標)

定義

pass@k (コード生成評価指標)とは — 詳しく解説

pass@k (コード生成評価指標)の使用例

pass@k (コード生成評価指標)に関連するAIツール

関連用語

「評価指標」の他の用語

AI用語辞典をすべて見てみませんか