下拉刷新
项目详情
navbar_avatar分享
repo_avatar
HelloGitHub 评分
0 人评分
开源的 LLM 评测框架
开源MIT
认领
收藏
分享
8k
星数
中文
Python
主语言
活跃
263
贡献者
479
Issues
组织
0.4.7
最新版本
2k
Forks
MIT
协议
更多
lm-evaluation-harness image
这是一个是用于评估大型语言模型的框架,能够测试模型在多种任务中的表现。它提供了超过 60 个学术基准测试,支持多种模型框架、本地模型、云服务(如 OpenAI)、硬件加速,以及自定义任务等功能。
收录于:
第 107 期
标签:
AI
LLM
Python

评论

评分:
暂无精选评论