llm-universe—《动手学大模型应用开发》该项目是专为小白开发者设计的大模型应用开发教程。内容涵盖了大模型的概念介绍、如何调用大模型API、知识库的搭建、构建 RAG(Retrieval-Augmentdatawhalechina·Jupyter·7 个月前2.1k
llama3-from-scratch—从头开始实现 Llama 3 的教程该项目通过逐层构建 Llama 3 的方式,帮助人们深入理解 LLM 是如何工作的。作者使用 PyTorch 框架,实现了加载模型权重、文本的分词处理、模型配置naklecha·Jupyter·6 个月前1.7k
ollama—本地运行各种 LLM 的工具这是一个用 Go 语言写的工具,用于在本地一条命令安装、启动和管理大型语言模型,支持 Llama 3、Gemma、Mistral 等大模型,适用于 Windowollama·Go·8 个月前1.9k
langchain—构建基于 LLM 应用的框架LLM 是基于大数据预先训练好的大型深度学习模型,该项目可让 LLM 无需再训练就能访问新的数据集。它提供了开发 LLM 应用所需的各种模块,包括连接上下文来源langchain-ai·Jupyter·7 个月前1.4k
LLaMA-Factory—专门针对 LLM 做微调的框架这是一个让微调大型语言模型变得轻松的开源项目,它支持 LLaMA、Mistral、ChatGLM 等多种模型,以及增量预训练、奖励模型训练和精度等级等功能。引入hiyouga·Python·7 个月前773
llm-course—免费开源的大语言模型课程这是个免费的 LLM 课程,内容包含面向新手入门 LLM 的基础知识,面向程序员和科学家的 LLMs 产品和部署 LLM 应用的知识和笔记。mlabonne·Jupyter·10 个月前2.4k
FastChat—用于训练和评估大型语言模型的开放平台这是一个用于训练、部署和评估大型语言模型的平台,你可以用它在本地部署和评估各种大模型。除此之外,它还提供了一个在线评估大模型的平台,用户可以向两个不同的大模型,lm-sys·Python·8 个月前635
ml-ferret—苹果开源的多模态语言大模型雪貂(Ferret)是苹果公司开源的多模态 LLM 模型,它可以分析和识别图像上的信息,并绘制边界框,当查询时可以做出响应。即提供一张图片,询问关于图像上信息的apple·Python·1 年前3.1k
llama3—Meta Llama 3 官方仓库Meta 开源的新一代大模型 Llama 3,虽然目前只放出了 8B 和 70B 两个版本,但是在评估结果上已经优于 Claude 3 Sonnet、Mistrmeta-llama·Python·7 个月前1.1k
ml-engineering—机器学习:LLM/VLM 训练与工程该项目是作者训练开源 BLOOM-176B 大模型和 IDEFICS-80B 多模态模型的经验总结,还提供了大量可以直接拿来用的代码和脚本,希望能够帮助你成功训stas00·Python·1 年前3.1k
DeepSpeed—微软开源的深度学习训练优化库众所周知训练大模型(LLM)是一件“费时费钱”的事情,该项目通过 ZeRO++ 技术,在训练时将模型状态分割到每个 GPU 上,通过提高吞吐量的方式,降低训练所microsoft·Python·1 年前1.5k