下拉刷新
项目详情
navbar_avatar分享
repo_avatar
HelloGitHub 评分
0 人评分
多格式文档解析和导出工具
开源MIT
认领
收藏
分享
9.4k
星数
中文
Python
主语言
活跃
18
贡献者
59
Issues
组织
2.5.2
最新版本
445
Forks
MIT
协议
更多
docling image
这是一个由 IBM 开源的 Python 工具,专门用于将各类文档转化为适合生成式 AI 使用的工具。它能够将 PDF、DOCX、PPTX、图片、HTML、Markdown 等多种流行文档格式,导出为 Markdown 和 JSON 格式,支持多种 OCR 引擎(PDF)、统一的文档对象(DoclingDocument),轻松集成检索增强生成(RAG)和问答应用,适用于需要将文档作为生成式 AI 模型输入的场景。
标签:
Python

评论

评分:
暂无精选评论