大模型排名 - HelloGitHub

下拉刷新

2026 年 8 月大模型排行榜

LMArena

排名	模型	分数
1	claude-fable-5	1509
2	claude-opus-4-6-thinking	1505
3	claude-opus-4-7-thinking	1502
4	claude-opus-4-6	1497
5	claude-opus-4-7	1492
6	claude-opus-5-high	1492
7	claude-opus-5-max	1490
8	muse-spark-1.1	1490
9	muse-spark	1488
10	gemini-3-pro	1486
11	gemini-3.1-pro	1485
12	kimi-k3-max	1485
13	claude-opus-4-8-thinking	1484
14	gpt-5.6-sol-xhigh	1483
15	gemini-3.6-flash	1483
16	gpt-5.5-high	1482
17	gpt-5.4-high	1477
18	gemini-3.5-flash-high	1476
19	gpt-5.5	1476
20	gpt-5.2-chat-latest	1476

排名	模型	分数	机构
1	claude-fable-5	1509	Anthropic
2	claude-opus-4-6-thinking	1505	Anthropic
3	claude-opus-4-7-thinking	1502	Anthropic
4	claude-opus-4-6	1497	Anthropic
5	claude-opus-4-7	1492	Anthropic
6	claude-opus-5-high	1492	Anthropic
7	claude-opus-5-max	1490	Anthropic
8	muse-spark-1.1	1490	Meta
9	muse-spark	1488	Meta
10	gemini-3-pro	1486	Google
11	gemini-3.1-pro	1485	Google
12	kimi-k3-max	1485	Moonshot
13	claude-opus-4-8-thinking	1484	Anthropic
14	gpt-5.6-sol-xhigh	1483	OpenAI
15	gemini-3.6-flash	1483	Google
16	gpt-5.5-high	1482	OpenAI
17	gpt-5.4-high	1477	OpenAI
18	gemini-3.5-flash-high	1476	Google
19	gpt-5.5	1476	OpenAI
20	gpt-5.2-chat-latest	1476	OpenAI

「LMArena 排名」是基于众包用户投票的大语言模型排行榜。通过让用户与两个匿名模型对话并选择更好的回答，使用 Elo 评分系统计算模型的相对实力。该排行榜覆盖文本、视觉、代码等多个能力维度，是目前最权威的 LLM 评测榜单之一，基于此榜单我们做了模型名称聚合和清理工作。

推荐项目

换一换