docling—多格式文档解析和导出工具这是一个由 IBM 开源的 Python 工具,专门用于将各类文档转化为适合生成式 AI 使用的工具。它能够将 PDF、DOCX、PPTX、图片、HTML、MaDS4SD·Python·5 天前756
paperless-ngx—纸质文档数字化存档工具1这是一个基于 Django 的文档管理系统,可将纸质文档转换成可搜索的在线存档。不同于普通的扫描仪将实体书变为难以检索的图片或 PDF 格式,它通过文档扫描器实paperless-ngx·Python·20 天前1.9k
HivisionIDPhotos—轻量级的 AI 证件照制作工具11这是一款简单易用的 AI 证件照制作工具,能够生成标准证件照和六寸排版照。它提供了简洁的 Web 界面和 API 服务,即使在没有 GPU 的电脑上也能够运行,Zeyi-Lin·Python·2 个月前5.7k
backtrader—Python 量化交易回测框架1该项目是用 Python 编写的回测库,专为开发和测试交易策略而设计。它可以从 CSV 文件、在线数据源和 pandas 中提取数据,支持多策略同步运行、生成交mementum·Python·20 天前679
crawl4ai—LLM 友好的异步爬虫框架1这是一款用 Python 开发的异步爬虫框架,能够将网站上的数据转化成 Markdown、JSON 等 LLM 友好的输出格式。它完全开源且免费,极大地简化了异unclecode·Python·1 个月前1.9k
core—开源的智能家居平台1这是一个用 Python 编写的智能家居平台,旨在整合不同品牌的智能设备,提供个性化的家庭自动化体验。它解决了传统系统互操作性(Interoperabilityhome-assistant·Python·20 天前846
moondream—小型的视觉语言模型这是一个可在资源受限的设备上运行的小型视觉语言模型,它能够理解并生成与图像相关的自然语言描述,支持图像识别、生成描述和问答等功能。vikhyat·Jupyter·20 天前609
LibreTranslate—可离线部署的翻译 API 服务1该项目是基于离线翻译引擎 Argos Translate 构建的翻译 API 服务。它不依赖第三方翻译服务,可轻松自建翻译 API 服务,支持自动语言检测、APLibreTranslate·Python·2 个月前1.9k
spaCy—强大的自然语言处理 Python 库这是一个工业级的自然语言处理(NLP)库,支持 70 多种语言的分词和训练。它采用 Python 编写,可实现标注、解析和文本分类等功能,并支持模型打包与部署。explosion·Python·20 天前499
pokeapi—宝可梦数据的 API 服务这是一个基于 Django 构建的宝可梦数据 RESTful API 服务,为开发者提供全面的宝可梦数据库,包括小精灵的动作、属性、技能和进化信息等详细资料。PokeAPI·Python·20 天前463
moshi—可实时对话的语音模型该项目利用先进的流式神经音频编码器 Mimi,实现了一个能够进行实时、同时听和说(全双工)、自然对话的语音系统。它不仅能听懂你说的话,还可以像正常对话一样回答你kyutai-labs·Python·2 个月前1.5k
SeleniumBase—功能全面的浏览器自动化框架1该项目是基于 Selenium 的 Python 自动化测试框架,集成了爬虫、自动化测试和生成报告等多种功能。它提供了丰富的示例,并且独特的 UC 模式,可以帮seleniumbase·Python·3 个月前2.2k
video2x—视频和图像无损放大工具该项目集成了多种超分辨率算法(如 Waifu2x、Anime4K、Real-ESRGAN),能够有效提高视频和图像的分辨率,并提供了图形界面(GUI)、Dockk4yt3x·C++·3 个月前2.2k