PDFMathTranslate—双语对照的 PDF 翻译工具这是一个基于 AI 的 PDF 文档翻译工具,专门用于翻译科学论文。它能够完整保留 PDF 文档的原始排版,确保译文与原文排版一致,实现双语对照翻译,支持 GoByaidu·Python·5 天前691
TRELLIS—生成 3D 作品的开源模型该项目是微软开源的 3D 生成模型,可通过文本或图像提示生成具有复杂形状和纹理细节的 3D 作品。由于采用了 CUDA 技术,运行该模型至少需要 16GB 内存microsoft·Python·5 天前539
Resume-Matcher—AI 驱动的简历匹配分析工具这是一个基于 AI 的免费开源工具,可用于提升简历质量。它通过解析简历和职位描述,模拟求职者跟踪系统(ATS),并利用 FastEmbed 技术计算简历与职位描srbhr·Python·19 天前1k
HivisionIDPhotos—轻量级的 AI 证件照制作工具12这是一款简单易用的 AI 证件照制作工具,能够生成标准证件照和六寸排版照。它提供了简洁的 Web 界面和 API 服务,即使在没有 GPU 的电脑上也能够运行,Zeyi-Lin·Python·4 个月前7k
exo—利用家用设备打造低成本的 AI 集群该项目能够利用日常家用设备(如手机、笔记本电脑、台式机等)来搭建家庭 AI 集群。它通过整合现有的设备,无需昂贵硬件,即可构建一个低成本、可扩展的 GPU 计算exo-explore·Python·1 个月前2.3k
krita-ai-diffusion—Krita 的 AI 绘画助手插件这是一个专为 Krita 绘画软件开发的 AIGC 插件,旨在提供更便捷和可控的图像生成体验。用户只需选择区域并输入文本提示,即可轻松实现图像填充、扩展、放大、Acly·Python·24 天前597
screenpipe—全天候录制屏幕的 AI 助手4这是一款开箱即用、可离线的桌面 AI 应用。它可以录制屏幕内容、捕获截图和音频,并将数据存储至本地数据库,结合 LLMs 的能力,实现自动记录、上下文感知的 Amediar-ai·TypeScript·2 个月前2.7k
netron—跨平台的机器学习模型查看工具这是一个神经网络、深度学习和机器学习模型的可视化工具,支持多种模型格式,包括 ONNX、TensorFlow Lite、Core ML、Keras、Caffe、lutzroeder·JavaScript·24 天前414
video2x—视频和图像无损放大工具1该项目集成了多种超分辨率算法(如 Waifu2x、Anime4K、Real-ESRGAN),能够有效提高视频和图像的分辨率,并提供了图形界面(GUI)、Dockk4yt3x·C++·4 个月前2.8k
Perplexica—AI 驱动的搜索引擎工具1这是一个开源的 AI 搜索引擎工具,灵感来源于 Perplexity AI。它结合了 SearxNG 和大语言模型(LLMs)等技术,能够理解你的问题并深入互联ItzCrazyKns·TypeScript·24 天前544
Deep-Live-Cam—实时换脸与深度伪造技术1该项目利用 AI 技术实现了视频和图片的实时人脸替换。用户仅需提供一张图片,即可将选定的人脸替换到目标视频或图片上,生成栩栩如生的深度伪造效果。它采用 Pythhacksider·Python·4 个月前3.5k
TensorRT-YOLO—灵活易用的 YOLO 部署工具这是一款专为 NVIDIA 设备优化的 YOLO 部署工具。它通过集成 TensorRT 插件和 CUDA 技术,提供 C++ 和 Python API,显著提laugh12321·C++·24 天前559
moshi—可实时对话的语音模型该项目利用先进的流式神经音频编码器 Mimi,实现了一个能够进行实时、同时听和说(全双工)、自然对话的语音系统。它不仅能听懂你说的话,还可以像正常对话一样回答你kyutai-labs·Python·3 个月前2k
udlbook—《Understanding Deep Learning》理解深度学习1该书是由 Simon J.D. Prince 编写的一本关于深度学习的专业书籍,内容涵盖深度学习的理论基础、性能评估、卷积网络、Transformers、图神经udlbook·Jupyter·2 个月前674
kotaemon—干净可定制的 RAG WebUI1该项目可以快速构建一个简洁、易于定制、拥有 Web 界面的 RAG 应用,让用户可以通过聊天的方式与本地文档交互。它不仅使用方便且功能丰富,支持多用户、文档预览Cinnamon·Python·3 个月前2.8k