AI 用語辞典評価指標
LM Arena (Chatbot Arena)
読み: えるえむあれな
最終更新: 2026-06-05 ・ AI PICKS 編集部
定義
ユーザー投票による LLM の人間評価ランキング。 Elo レーティングで モデルを順位付け。
LM Arena (Chatbot Arena) とは — 詳しく解説
LM Arena (旧 Chatbot Arena) は カリフォルニア大バークレー校 発の LLM 評価プラットフォームで、 ユーザーが 同じ質問に対する 2 モデルの回答を見比べて投票し、 Elo レーティングで順位付けする。 2026 年現在、 国内外の AI 開発者が 新モデル投入時の参照指標として最重要視。 ベンチマーク(MMLU 等) のリーク問題を回避できる長所がある一方、 「丁寧な口調」 や 「長文回答」 が好まれる人間バイアスも指摘される。 AI PICKS では LM Arena スコアを 全 LLM 比較記事に併記し、 ベンチマークだけでは見えない 実用品質の参考にしている。
LM Arena (Chatbot Arena) に関連する AI ツール
関連用語
「評価指標」 の他の用語
AI 用語辞典をすべて見てみませんか
12 カテゴリ・ 51 語以上を体系的に整理しています
辞典トップへ