Arena.aiのAgent Modeは、LLM評価プラットフォームArenaが提供する自律型AIエージェント機能。Webブラウジング、サンドボックス環境でのコード実行、画像生成、レポート作成など複数のツールを組み合わせて複雑なタスクを一連の手順で処理する。GPT-5.5やClaude Opus 4.7、Gemini 3.1 Proなど主要モデルを横断して同じタスクに投入し、タスク達成率・操作追従性・ツール幻覚の3軸でパフォーマンスを計測できる点が特徴。リサーチレポートの作成、スライド生成、Webサイト構築、デバッグといった実務タスクをエージェントに委任しつつ、モデル間の比較評価を同時に行いたいエンジニアや研究者に向いている。