Foundations-of-LLMs—《大模型基础》3该书是由浙江大学 DAILY 实验室开源的大语言模型教材,内容涵盖传统语言模型、大语言模型架构演化、Prompt 工程、参数高效微调、模型编辑、检索增强生成等方ZJU-LLMs·Other·1 个月前2.6k
minimind—从零开始训练小型语言模型1这不仅是一个微型语言模型的实现,更是一份入门 LLM 的教程,旨在降低学习和上手 LLM 的门槛 。它提供了从数据预处理到模型训练、微调和推理的全流程代码和教程jingyaogong·Python·1 个月前2k
DeepSeek-R1—DeepSeek 开源的推理模型该项目创造性地基于 DeepSeek V3 基座模型,采用大规模强化学习技术,成功训练出一个完全通过强化学习增强的推理模型。它拥有比肩 OpenAI o1 正式deepseek-ai·Other·12 天前1.4k
DeepSeek-V3—DeepSeek 开源的混合专家模型5这是一个基于混合专家(MoE)和多头潜在注意力(MLA)架构的开源大语言模型,在数学推理、代码生成等复杂任务中表现优秀。该模型总规模达 671B 参数,但每个 deepseek-ai·Python·2 个月前5.2k
vllm—更高效的 LLMs 推理和服务引擎这是一个高效易用的大型语言模型推理引擎,专为解决推理速度慢、资源利用率低等问题而设计。它基于 PyTorch 和 CUDA,并结合内存优化算法(PagedAttvllm-project·Python·2 个月前813
garak—开源的 LLMs 漏洞扫描工具该项目是 NVIDIA 开源的用于扫描 LLMs 漏洞的工具,支持检测 LLM 可能存在的安全问题和不良行为,包括幻觉、数据泄漏、提示注入、错误信息、有毒内容生NVIDIA·Python·2 个月前376
llm-universe—《动手学大模型应用开发》该项目是专为小白开发者设计的大模型应用开发教程。内容涵盖了大模型的概念介绍、如何调用大模型API、知识库的搭建、构建 RAG(Retrieval-Augmentdatawhalechina·Jupyter·10 个月前2.7k
llama3-from-scratch—从头开始实现 Llama 3 的教程该项目通过逐层构建 Llama 3 的方式,帮助人们深入理解 LLM 是如何工作的。作者使用 PyTorch 框架,实现了加载模型权重、文本的分词处理、模型配置naklecha·Jupyter·9 个月前2k
ollama—本地运行各种 LLM 的工具这是一个用 Go 语言写的工具,用于在本地一条命令安装、启动和管理大型语言模型,支持 Llama 3、Gemma、Mistral 等大模型,适用于 Windowollama·Go·1 年前2.3k
llm-course—免费开源的大语言模型课程这是个免费的 LLM 课程,内容包含面向新手入门 LLM 的基础知识,面向程序员和科学家的 LLMs 产品和部署 LLM 应用的知识和笔记。mlabonne·Jupyter·1 年前2.6k
langchain—构建基于 LLM 应用的框架LLM 是基于大数据预先训练好的大型深度学习模型,该项目可让 LLM 无需再训练就能访问新的数据集。它提供了开发 LLM 应用所需的各种模块,包括连接上下文来源langchain-ai·Jupyter·10 个月前1.6k
LLaMA-Factory—专门针对 LLM 做微调的框架这是一个让微调大型语言模型变得轻松的开源项目,它支持 LLaMA、Mistral、ChatGLM 等多种模型,以及增量预训练、奖励模型训练和精度等级等功能。引入hiyouga·Python·10 个月前945
FastChat—用于训练和评估大型语言模型的开放平台这是一个用于训练、部署和评估大型语言模型的平台,你可以用它在本地部署和评估各种大模型。除此之外,它还提供了一个在线评估大模型的平台,用户可以向两个不同的大模型,lm-sys·Python·1 年前793
ml-ferret—苹果开源的多模态语言大模型雪貂(Ferret)是苹果公司开源的多模态 LLM 模型,它可以分析和识别图像上的信息,并绘制边界框,当查询时可以做出响应。即提供一张图片,询问关于图像上信息的apple·Python·1 年前3.3k