Question 1

パープレキシティ (困惑度)とは何ですか？

Accepted Answer

パープレキシティとは、言語モデルがテキストをどれほど的確に予測できるかを数値で示す評価指標のこと。値が低いほど予測精度が高く、LLMの開発・比較・ファインチューニング評価で広く用いられる。 パープレキシティ（Perplexity、PPL）は、言語モデルの評価に用いられる代表的な指標で、モデルが与えられたテキストをどれほど的確に予測できるかを数値化したもの。テキスト全体の確率の幾何平均の逆数として定義され、値が低いほど高性能とされる。LLM開発では訓練損失の代替指標として広く使われ、モデルサイズやデータ量との相関を把握する際にも有用だ。

2026年の実運用現場での注意点は3つある。①

Question 2

パープレキシティ (困惑度)の使い方や活用例を教えてください

Accepted Answer

代表的な活用例は次のとおりです。ファインチューニング後にPPLが30%低下した事例では回答満足度が向上したが、ハルシネーション率は改善しなかった。 / 「PPL=15のモデルとPPL=25のモデル、実務ではどちらが適切か」をプロンプトでタスク特性から判断させる活用例。詳細な解説はパープレキシティ (困惑度)の詳細ページをご覧ください。

Question 3

パープレキシティ (困惑度)とLLM (大規模言語モデル)の違いは何ですか？

Accepted Answer

パープレキシティ (困惑度)とLLM (大規模言語モデル)はAI用語として関連していますが、役割や使用場面が異なります。パープレキシティ (困惑度)はパープレキシティとは、言語モデルがテキストをどれほど的確に予測できるかを数値で示す評価指標のこと。値が低いほど予測精度が高く、LLMの開発・比較・ファインチューニング評価で広く用いられる。詳しくは関連用語の解説ページをご参照ください。

パープレキシティ (困惑度)

定義

パープレキシティ (困惑度)とは — 詳しく解説

パープレキシティ (困惑度)の使用例

パープレキシティ (困惑度)に関連するAIツール

関連用語

「評価指標」の他の用語

AI用語辞典をすべて見てみませんか