下拉刷新
2026 年 1 月大模型排行榜
rank_logo
排名模型分数
1gemini-3-pro
1489
2grok-4.1-thinking
1477
3gemini-3-flash
1471
4claude-opus-4-5-thinking-32k
1468
5claude-opus-4-5
1467
6grok-4.1
1466
7gemini-3-flash (thinking-minimal)
1464
8gpt-5.1-high
1460
9claude-sonnet-4-5-thinking-32k
1452
10gemini-2.5-pro
1450
11claude-sonnet-4-5
1450
12claude-opus-4-1-thinking-16k
1449
13ernie-5.0
1447
14claude-opus-4-1
1445
15gpt-4.5
1444
16gpt-5.2-high
1444
17glm-4.7
1443
18chatgpt-4o-latest
1442
19gpt-5.2
1441
20gpt-5.1
1436

「LMArena 排名」是基于众包用户投票的大语言模型排行榜。通过让用户与两个匿名模型对话并选择更好的回答,使用 Elo 评分系统计算模型的相对实力。该排行榜覆盖文本、视觉、代码等多个能力维度,是目前最权威的 LLM 评测榜单之一,基于此榜单我们做了模型名称聚合和清理工作。