项目详情
由
分享


HelloGitHub 评分
10.0
1 人评分
开源•MIT
认领
讨论
收藏
分享
21.1k
星数
否
中文
Python
主语言
是
活跃
14
贡献者
149
Issues
是
组织
无
最新版本
2k
Forks
MIT
协议
更多

该项目是微软专为 CPU 本地推理和极致压缩(低比特)大模型设计的推理框架。它支持对 1-bit/1.58-bit 量化模型进行高效、低能耗的推理,兼容 BitNet、Llama3-8B-1.58、Falcon3 等模型,适用于在本地或边缘设备上运行大模型推理任务,无需 GPU。
评论
评分:
暂无精选评论