DeepSeek-V3—DeepSeek 开源的混合专家模型2这是一个基于混合专家(MoE)和多头潜在注意力(MLA)架构的开源大语言模型,在数学推理、代码生成等复杂任务中表现优秀。该模型总规模达 671B 参数,但每个 deepseek-ai·Python·15 天前2k
PDFMathTranslate—双语对照的 PDF 翻译工具2这是一个基于 AI 的 PDF 文档翻译工具,专门用于翻译科学论文。它能够完整保留 PDF 文档的原始排版,确保译文与原文排版一致,实现双语对照翻译,支持 GoByaidu·Python·1 个月前2.4k
MagicMirror—零门槛 AI 换脸应用3这是一款轻量级、开箱即用的 AI 换脸工具,无需 GPU、可离线使用,一键轻松尝试新形象(发型、穿搭等)。idootop·TypeScript·25 天前2.4k
xiaozhi-esp32—基于 ESP32 的 AI 聊天机器人1这是一款基于 ESP-IDF 开发框架的开源硬件项目,旨在利用低成本硬件打造个人专属的 AI 聊天机器人。它通过 WebSocket 或 UDP 协议与 LLM78·C·7 天前816
zerox—使用视觉模型将 PDF 转换为 Markdown该项目基于视觉模型 API 服务,提供了将 PDF 文档转化为 Markdown 的功能。其原理是先将原文件(如 pdf、docx)转换为图片,然后把图片发给视getomni-ai·Python·25 天前1k
HivisionIDPhotos—轻量级的 AI 证件照制作工具13这是一款简单易用的 AI 证件照制作工具,能够生成标准证件照和六寸排版照。它提供了简洁的 Web 界面和 API 服务,即使在没有 GPU 的电脑上也能够运行,Zeyi-Lin·Python·5 个月前8.2k
TRELLIS—生成 3D 作品的开源模型该项目是微软开源的 3D 生成模型,可通过文本或图像提示生成具有复杂形状和纹理细节的 3D 作品。由于采用了 CUDA 技术,运行该模型至少需要 16GB 内存microsoft·Python·1 个月前1.6k
vllm—更高效的 LLMs 推理和服务引擎这是一个高效易用的大型语言模型推理引擎,专为解决推理速度慢、资源利用率低等问题而设计。它基于 PyTorch 和 CUDA,并结合内存优化算法(PagedAttvllm-project·Python·25 天前523
Resume-Matcher—AI 驱动的简历匹配分析工具这是一个基于 AI 的免费开源工具,可用于提升简历质量。它通过解析简历和职位描述,模拟求职者跟踪系统(ATS),并利用 FastEmbed 技术计算简历与职位描srbhr·Python·2 个月前1.5k
exo—利用家用设备打造低成本的 AI 集群该项目能够利用日常家用设备(如手机、笔记本电脑、台式机等)来搭建家庭 AI 集群。它通过整合现有的设备,无需昂贵硬件,即可构建一个低成本、可扩展的 GPU 计算exo-explore·Python·2 个月前3k
letta—为 LLM 应用注入记忆能力的开发框架该项目是用于构建具有记忆功能的 LLM 应用的 Python 框架,支持创建拥有长期记忆和持久状态的智能体(Agent),并能够集成多种 LLM API 服务。letta-ai·Python·25 天前345
krita-ai-diffusion—Krita 的 AI 绘画助手插件这是一个专为 Krita 绘画软件开发的 AIGC 插件,旨在提供更便捷和可控的图像生成体验。用户只需选择区域并输入文本提示,即可轻松实现图像填充、扩展、放大、Acly·Python·2 个月前906
screenpipe—全天候录制屏幕的 AI 助手4这是一款开箱即用、可离线的桌面 AI 应用。它可以录制屏幕内容、捕获截图和音频,并将数据存储至本地数据库,结合 LLMs 的能力,实现自动记录、上下文感知的 Amediar-ai·TypeScript·3 个月前3.2k
Deep-Live-Cam—实时换脸与深度伪造技术1该项目利用 AI 技术实现了视频和图片的实时人脸替换。用户仅需提供一张图片,即可将选定的人脸替换到目标视频或图片上,生成栩栩如生的深度伪造效果。它采用 Pythhacksider·Python·5 个月前3.9k
video2x—视频和图像无损放大工具2该项目集成了多种超分辨率算法(如 Waifu2x、Anime4K、Real-ESRGAN),能够有效提高视频和图像的分辨率,并提供了图形界面(GUI)、Dockk4yt3x·C++·5 个月前3.3k