GLM-4.5—智谱开源的旗舰模型系列2这是一个专为智能体应用打造的基础模型。GLM-4.5 总参数为 355B 激活参数为 32B,在工具调用、网页浏览、软件工程、前端编程领域进行了优化,可以接入 zai-org·Python·1 个月前4.5k
happy-llm—从零开始的 LLM 原理与实践教程该项目是帮助初学习者系统地学习大语言模型(LLM)原理与实践的教程。通过详细的教程和实战案例,循序渐进地带领读者深入了解自然语言处理(NLP)基础、Transfdatawhalechina·Jupyter·2 个月前2.8k
minimind-v—从零开始训练视觉多模态模型该项目是手把手教你从零开始训练一个 26M 参数的视觉多模态模型,包括完整的训练流程和全套的工具集,成本 1.3 元、耗时仅 1 小时。jingyaogong·Python·5 个月前1.5k
minimind—从零开始训练小型语言模型3这不仅是一个微型语言模型的实现,更是一份入门 LLM 的教程,旨在降低学习和上手 LLM 的门槛 。它提供了从数据预处理到模型训练、微调和推理的全流程代码和教程jingyaogong·Python·7 个月前6.9k
Foundations-of-LLMs—《大模型基础》5该书是由浙江大学 DAILY 实验室开源的大语言模型教材,内容涵盖传统语言模型、大语言模型架构演化、Prompt 工程、参数高效微调、模型编辑、检索增强生成等方ZJU-LLMs·Other·7 个月前7.2k
DeepSeek-R1—DeepSeek 开源的推理模型该项目创造性地基于 DeepSeek V3 基座模型,采用大规模强化学习技术,成功训练出一个完全通过强化学习增强的推理模型。它拥有比肩 OpenAI o1 正式deepseek-ai·Other·7 个月前3.1k
DeepSeek-V3—DeepSeek 开源的混合专家模型9这是一个基于混合专家(MoE)和多头潜在注意力(MLA)架构的开源大语言模型,在数学推理、代码生成等复杂任务中表现优秀。该模型总规模达 671B 参数,但每个 deepseek-ai·Python·8 个月前8.3k
lm-evaluation-harness—开源的 LLM 评测框架这是一个是用于评估大型语言模型的框架,能够测试模型在多种任务中的表现。它提供了超过 60 个学术基准测试,支持多种模型框架、本地模型、云服务(如 OpenAI)EleutherAI·Python·6 个月前638
vllm—更高效的 LLMs 推理和服务引擎这是一个高效易用的大型语言模型推理引擎,专为解决推理速度慢、资源利用率低等问题而设计。它基于 PyTorch 和 CUDA,并结合内存优化算法(PagedAttvllm-project·Python·8 个月前2.1k
garak—开源的 LLMs 漏洞扫描工具该项目是 NVIDIA 开源的用于扫描 LLMs 漏洞的工具,支持检测 LLM 可能存在的安全问题和不良行为,包括幻觉、数据泄漏、提示注入、错误信息、有毒内容生NVIDIA·Python·8 个月前975
llm-universe—《动手学大模型应用开发》1该项目是专为小白开发者设计的大模型应用开发教程。内容涵盖了大模型的概念介绍、如何调用大模型API、知识库的搭建、构建 RAG(Retrieval-Augmentdatawhalechina·Jupyter·1 年前4.4k
llama3-from-scratch—从头开始实现 Llama 3 的教程该项目通过逐层构建 Llama 3 的方式,帮助人们深入理解 LLM 是如何工作的。作者使用 PyTorch 框架,实现了加载模型权重、文本的分词处理、模型配置naklecha·Jupyter·1 年前2.6k
langchain—构建基于 LLM 应用的框架LLM 是基于大数据预先训练好的大型深度学习模型,该项目可让 LLM 无需再训练就能访问新的数据集。它提供了开发 LLM 应用所需的各种模块,包括连接上下文来源langchain-ai·Jupyter·1 年前2k
LLaMA-Factory—专门针对 LLM 做微调的框架这是一个让微调大型语言模型变得轻松的开源项目,它支持 LLaMA、Mistral、ChatGLM 等多种模型,以及增量预训练、奖励模型训练和精度等级等功能。引入hiyouga·Python·1 年前1.4k
ollama—本地运行各种 LLM 的工具这是一个用 Go 语言写的工具,用于在本地一条命令安装、启动和管理大型语言模型,支持 Llama 3、Gemma、Mistral 等大模型,适用于 Windowollama·Go·1 年前2.9k