AI PICKS
AI 用語辞典評価指標

LM Arena (Chatbot Arena)

読み: えるえむあれな

最終更新: 2026-06-05 ・ AI PICKS 編集部

定義

ユーザー投票による LLM の人間評価ランキング。 Elo レーティングで モデルを順位付け。

LM Arena (Chatbot Arena) とは — 詳しく解説

LM Arena (旧 Chatbot Arena) は カリフォルニア大バークレー校 発の LLM 評価プラットフォームで、 ユーザーが 同じ質問に対する 2 モデルの回答を見比べて投票し、 Elo レーティングで順位付けする。 2026 年現在、 国内外の AI 開発者が 新モデル投入時の参照指標として最重要視。 ベンチマーク(MMLU 等) のリーク問題を回避できる長所がある一方、 「丁寧な口調」 や 「長文回答」 が好まれる人間バイアスも指摘される。 AI PICKS では LM Arena スコアを 全 LLM 比較記事に併記し、 ベンチマークだけでは見えない 実用品質の参考にしている。

LM Arena (Chatbot Arena) に関連する AI ツール

関連用語

評価指標」 の他の用語

AI 用語辞典をすべて見てみませんか

12 カテゴリ・ 51 語以上を体系的に整理しています

辞典トップへ