2026 年 5 月大模型排行榜

| 排名 | 模型 | 分数 |
|---|---|---|
| 1 | claude-opus-4-6-thinking | 1502 |
| 2 | claude-opus-4-7-thinking | 1501 |
| 3 | claude-opus-4-6 | 1498 |
| 4 | claude-opus-4-7 | 1492 |
| 5 | muse-spark | 1491 |
| 6 | gemini-3.1-pro | 1490 |
| 7 | gemini-3-pro | 1486 |
| 8 | gpt-5.5-high | 1484 |
| 9 | grok-4.20-beta1 | 1479 |
| 10 | gpt-5.4-high | 1479 |
| 11 | gpt-5.2-chat-latest | 1477 |
| 12 | grok-4.20-beta-reasoning | 1477 |
| 13 | gpt-5.5 | 1476 |
| 14 | grok-4.20-multi-agent-beta | 1474 |
| 15 | gemini-3-flash | 1474 |
| 16 | ernie-5.1 | 1473 |
| 17 | claude-opus-4-5-thinking-32k | 1473 |
| 18 | gpt-5.5-instant | 1472 |
| 19 | glm-5.1 | 1471 |
| 20 | claude-opus-4-5 | 1468 |
| 排名 | 模型 | 分数 | 机构 |
|---|---|---|---|
| 1 | claude-opus-4-6-thinking | 1502 | Anthropic |
| 2 | claude-opus-4-7-thinking | 1501 | Anthropic |
| 3 | claude-opus-4-6 | 1498 | Anthropic |
| 4 | claude-opus-4-7 | 1492 | Anthropic |
| 5 | muse-spark | 1491 | Meta |
| 6 | gemini-3.1-pro | 1490 | |
| 7 | gemini-3-pro | 1486 | |
| 8 | gpt-5.5-high | 1484 | OpenAI |
| 9 | grok-4.20-beta1 | 1479 | xAI |
| 10 | gpt-5.4-high | 1479 | OpenAI |
| 11 | gpt-5.2-chat-latest | 1477 | OpenAI |
| 12 | grok-4.20-beta-reasoning | 1477 | xAI |
| 13 | gpt-5.5 | 1476 | OpenAI |
| 14 | grok-4.20-multi-agent-beta | 1474 | xAI |
| 15 | gemini-3-flash | 1474 | |
| 16 | ernie-5.1 | 1473 | Baidu |
| 17 | claude-opus-4-5-thinking-32k | 1473 | Anthropic |
| 18 | gpt-5.5-instant | 1472 | OpenAI |
| 19 | glm-5.1 | 1471 | Z.ai |
| 20 | claude-opus-4-5 | 1468 | Anthropic |
「LMArena 排名」是基于众包用户投票的大语言模型排行榜。通过让用户与两个匿名模型对话并选择更好的回答,使用 Elo 评分系统计算模型的相对实力。该排行榜覆盖文本、视觉、代码等多个能力维度,是目前最权威的 LLM 评测榜单之一,基于此榜单我们做了模型名称聚合和清理工作。