難易度の高いプロンプトにおけるユーザー選好を集計したArena Eloスコアです。
Anthropic
Claude Opus 4.6
Google
Gemini 3.1 Pro
ChatGPT
GPT-5.4
GPT-5.4 Pro
Grok
Grok 4.20
Grok 4.20 (Reasoning)
Claude Opus 4.5
Claude Sonnet 4.6
Z.ai
GLM-5.1
Gemini 3 Flash
Claude Sonnet 4.5
GPT-5.4 Mini
Claude Opus 4.1
Xiaomi
MiMo-V2-Pro
GLM-5
Moonshot AI
Kimi K2.5
Gemma 4 31B
Baidu
ERNIE 5.0 Thinking
Qwen
Qwen3.5 397B A17B
Meituan
Longcat Flash Chat
Gemini 2.5 Pro
Claude Opus 4
Gemini 3.1 Flash Lite
DeepSeek
DeepSeek V3.2
GPT-5
Grok 4.1 Fast
Grok 4.1 Fast (Reasoning)
Claude Haiku 4.5
Claude Sonnet 4
MiniMax
MiniMax M2.5
MiniMax M2.7
Gemini 2.5 Flash
GPT-5.4 Nano
GPT-5 Mini
Arcee AI
Trinity Large Thinking
Gemini 2.5 Flash Lite
GPT OSS 120B
Amazon
Nova 2 Lite
GPT-5 Nano
Meta AI
Llama 4 Maverick
Llama 4 Scout
GPT-4.1