Question 1

ROUGE (要約評価指標)とは何ですか？

Accepted Answer

ROUGEとはLLMや機械翻訳が生成したテキストを参照テキストとのn-gram一致率で自動採点する要約評価指標のこと。 ROUGE（Recall-Oriented Understudy for Gisting Evaluation）は、生成テキストと人手作成の参照テキストの単語・フレーズ重複度を計算して品質を数値化するNLP評価指標群。ROUGE-1（単語単位）・ROUGE-2（バイグラム）・ROUGE-L（最長共通部分列）の3種が実務でよく使われる。

2026年の実運用における最大の落とし穴は「スコアが高くても

Question 2

ROUGE (要約評価指標)の使い方や活用例を教えてください

Accepted Answer

代表的な活用例は次のとおりです。要約モデル評価: ROUGE-Lが0.45未満の出力をLLM-as-Judgeで再評価し、品質閾値を二段階で管理する運用が増えている。 / RAG品質の週次モニタリング: 参照QA100件でROUGE-2を計測し、スコア低下時にリトリーバー設定を見直すトリガーにする。詳細な解説はROUGE (要約評価指標)の詳細ページをご覧ください。

Question 3

ROUGE (要約評価指標)とLLM (大規模言語モデル)の違いは何ですか？

Accepted Answer

ROUGE (要約評価指標)とLLM (大規模言語モデル)はAI用語として関連していますが、役割や使用場面が異なります。ROUGE (要約評価指標)はROUGEとはLLMや機械翻訳が生成したテキストを参照テキストとのn-gram一致率で自動採点する要約評価指標のこと。詳しくは関連用語の解説ページをご参照ください。

ROUGE (要約評価指標)

定義

ROUGE (要約評価指標)とは — 詳しく解説

ROUGE (要約評価指標)の使用例

ROUGE (要約評価指標)に関連するAIツール

関連用語

「評価指標」の他の用語

AI用語辞典をすべて見てみませんか