下拉刷新
2026 年 2 月大模型排行榜
rank_logo
排名模型分数
1claude-opus-4-6
1496
2gemini-3-pro
1486
3grok-4.1-thinking
1475
4gemini-3-flash
1470
5claude-opus-4-5-thinking-32k
1468
6claude-opus-4-5
1467
7grok-4.1
1465
8gemini-3-flash (thinking-minimal)
1463
9gpt-5.1-high
1458
10ernie-5.0
1452
11claude-sonnet-4-5
1450
12claude-sonnet-4-5-thinking-32k
1450
13gemini-2.5-pro
1450
14kimi-k2.5-thinking
1449
15claude-opus-4-1-thinking-16k
1449
16claude-opus-4-1
1445
17gpt-4.5
1444
18chatgpt-4o-latest
1442
19glm-4.7
1441
20gpt-5.2-high
1438

「LMArena 排名」是基于众包用户投票的大语言模型排行榜。通过让用户与两个匿名模型对话并选择更好的回答,使用 Elo 评分系统计算模型的相对实力。该排行榜覆盖文本、视觉、代码等多个能力维度,是目前最权威的 LLM 评测榜单之一,基于此榜单我们做了模型名称聚合和清理工作。