SwanLab—AI 训练跟踪与可视化平台3这是一款开源、轻量的 AI 模型训练跟踪与可视化工具,旨在帮助研究者优化训练过程并提升团队协作效率。它通过简洁的 Python API 和直观的 UI 界面,提SwanHubX·Python·5 天前1.1k
ColossalAI—让 AI 大模型更低成本、方便易用、高效扩展高效的分布式人工智能训练系统。它能帮助用户在提升人工智能训练效率的同时降低训练成本,从而适应快速迭代的算法和模型,将 AI 大模型以低成本便捷推广到更多应用场景hpcaitech·Python·3 年前4.5k
open-webui—一站式的自托管 AI 平台3这是一个功能强大、用户友好的自托管 AI 平台,支持完全离线运行。它集成了多种大型语言模型运行器,如 Ollama 和 OpenAI 兼容的 API,支持网页搜open-webui·JavaScript·11 天前2k
Foundations-of-LLMs—《大模型基础》3该书是由浙江大学 DAILY 实验室开源的大语言模型教材,内容涵盖传统语言模型、大语言模型架构演化、Prompt 工程、参数高效微调、模型编辑、检索增强生成等方ZJU-LLMs·Other·1 个月前2.6k
minimind—从零开始训练小型语言模型1这不仅是一个微型语言模型的实现,更是一份入门 LLM 的教程,旨在降低学习和上手 LLM 的门槛 。它提供了从数据预处理到模型训练、微调和推理的全流程代码和教程jingyaogong·Python·1 个月前2k
DeepSeek-R1—DeepSeek 开源的推理模型该项目创造性地基于 DeepSeek V3 基座模型,采用大规模强化学习技术,成功训练出一个完全通过强化学习增强的推理模型。它拥有比肩 OpenAI o1 正式deepseek-ai·Other·11 天前1.4k
DeepSeek-V3—DeepSeek 开源的混合专家模型5这是一个基于混合专家(MoE)和多头潜在注意力(MLA)架构的开源大语言模型,在数学推理、代码生成等复杂任务中表现优秀。该模型总规模达 671B 参数,但每个 deepseek-ai·Python·1 个月前5.2k
PDFMathTranslate—双语对照的 PDF 翻译工具4这是一个基于 AI 的 PDF 文档翻译工具,专门用于翻译科学论文。它能够完整保留 PDF 文档的原始排版,确保译文与原文排版一致,实现双语对照翻译,支持 GoByaidu·Python·2 个月前3.8k
agent-service-toolkit—轻量级的 AI 代理开发框架该项目能够帮助开发者用 Python 快速搭建和运行基于 LangGraph 框架的 AI 代理服务。它结合 FastAPI、Streamlit 和 PydanJoshuaC215·Python·11 天前487
unsloth—新手友好的 LLM 微调工具库该项目是用于微调和优化大型语言模型(LLM)的 Python 工具库。它通过动态量化和显存优化技术,提高了模型微调速度,同时将显存占用降低 70%-80%,并支unslothai·Python·11 天前607
MagicMirror—零门槛 AI 换脸应用3这是一款轻量级、开箱即用的 AI 换脸工具,无需 GPU、可离线使用,一键轻松尝试新形象(发型、穿搭等)。idootop·TypeScript·2 个月前3.5k
HivisionIDPhotos—轻量级的 AI 证件照制作工具13这是一款简单易用的 AI 证件照制作工具,能够生成标准证件照和六寸排版照。它提供了简洁的 Web 界面和 API 服务,即使在没有 GPU 的电脑上也能够运行,Zeyi-Lin·Python·6 个月前9.1k
lite.ai.toolkit—轻量级的 C++ AI 工具包这是一个用 C++ 编写的 AI 工具包,内置超过 100 种 AI 模型,包括对象检测、人脸识别、分割、抠图等领域。它支持 ONNXRuntime、MNN、NDefTruth·C++·1 个月前468
AI-on-the-edge-device—将“旧”设备接入数字世界该项目基于 ESP32 等便宜的硬件(不到 10 欧)和 TensorFlow Lite 框架,实现对仪表数字的自动识别和数据传输,轻松将传统设备(水表、燃气表jomjol·C++·1 个月前628
zerox—使用视觉模型将 PDF 转换为 Markdown该项目基于视觉模型 API 服务,提供了将 PDF 文档转化为 Markdown 的功能。其原理是先将原文件(如 pdf、docx)转换为图片,然后把图片发给视getomni-ai·TypeScript·2 个月前1.4k