LLM 标签的开源项目

LLM

标签

local-llm—本地运行 SOTA 大模型实录

该项目是作者整理的本地运行前沿开源大模型实践指南，记录了从 2k 到 40k 美元的硬件方案，内容涵盖硬件清单、BIOS 调优、Docker 配置等。

jamesob

·Shell·4 天前

203

train-llm-from-scratch—从零开始训练大语言模型
1

该项目是手把手带你从零训练大语言模型的实战教程，不是简单调用 transformers 跑个示例，而是用 PyTorch 从底层实现 Transformer、预

FareedKhan-dev

·Python·1 个月前

2.5k

nanochat—自己动手打造 ChatGPT 聊天机器人
6

这是一个极简、低成本实现类似 ChatGPT 聊天机器人的大语言模型（LLM）实践项目。开发者仅需 8 张 H100 显卡，即可完成数据处理、预训练、微调、评测

karpathy

·Python·9 个月前

3.8k

GLM-4.5—智谱开源的旗舰模型系列
2

这是一个专为智能体应用打造的基础模型。GLM-4.5 总参数为 355B 激活参数为 32B，在工具调用、网页浏览、软件工程、前端编程领域进行了优化，可以接入

zai-org

·Python·1 年前

6.2k

happy-llm—从零开始的 LLM 原理与实践教程

该项目是帮助初学习者系统地学习大语言模型（LLM）原理与实践的教程。通过详细的教程和实战案例，循序渐进地带领读者深入了解自然语言处理（NLP）基础、Transf

datawhalechina

·Jupyter·1 年前

6.2k

minimind-v—从零开始训练视觉多模态模型

该项目是手把手教你从零开始训练一个 26M 参数的视觉多模态模型，包括完整的训练流程和全套的工具集，成本 1.3 元、耗时仅 1 小时。

jingyaogong

·Python·1 年前

3.1k

minimind—从零开始训练小型语言模型
4

这不仅是一个微型语言模型的实现，更是一份入门 LLM 的教程，旨在降低学习和上手 LLM 的门槛。它提供了从数据预处理到模型训练、微调和推理的全流程代码和教程

jingyaogong

·Python·2 年前

1.3w

Foundations-of-LLMs—《大模型基础》
5

该书是由浙江大学 DAILY 实验室开源的大语言模型教材，内容涵盖传统语言模型、大语言模型架构演化、Prompt 工程、参数高效微调、模型编辑、检索增强生成等方

ZJU-LLMs

·Other·2 年前

9.8k

DeepSeek-R1—DeepSeek 开源的推理模型

该项目创造性地基于 DeepSeek V3 基座模型，采用大规模强化学习技术，成功训练出一个完全通过强化学习增强的推理模型。它拥有比肩 OpenAI o1 正式

deepseek-ai

·Other·1 年前

4.5k

DeepSeek-V3—DeepSeek 开源的混合专家模型
9

这是一个基于混合专家（MoE）和多头潜在注意力（MLA）架构的开源大语言模型，在数学推理、代码生成等复杂任务中表现优秀。该模型总规模达 671B 参数，但每个

deepseek-ai

·Python·2 年前

lm-evaluation-harness—开源的 LLM 评测框架

这是一个是用于评估大型语言模型的框架，能够测试模型在多种任务中的表现。它提供了超过 60 个学术基准测试，支持多种模型框架、本地模型、云服务（如 OpenAI）

EleutherAI

·Python·1 年前

2.2k

vllm—更高效的 LLMs 推理和服务引擎

这是一个高效易用的大型语言模型推理引擎，专为解决推理速度慢、资源利用率低等问题而设计。它基于 PyTorch 和 CUDA，并结合内存优化算法（PagedAtt

vllm-project

·Python·2 年前

garak—开源的 LLMs 漏洞扫描工具

该项目是 NVIDIA 开源的用于扫描 LLMs 漏洞的工具，支持检测 LLM 可能存在的安全问题和不良行为，包括幻觉、数据泄漏、提示注入、错误信息、有毒内容生

NVIDIA

·Python·2 年前

2.2k

llm-universe—《动手学大模型应用开发》
1

该项目是专为小白开发者设计的大模型应用开发教程。内容涵盖了大模型的概念介绍、如何调用大模型API、知识库的搭建、构建 RAG（Retrieval-Augment

datawhalechina

·Jupyter·2 年前

6.7k

llama3-from-scratch—从头开始实现 Llama 3 的教程

该项目通过逐层构建 Llama 3 的方式，帮助人们深入理解 LLM 是如何工作的。作者使用 PyTorch 框架，实现了加载模型权重、文本的分词处理、模型配置

naklecha

·Jupyter·2 年前

3.6k

- 到底了，目前只开放了这些 -

推荐项目

换一换