下拉刷新
项目详情
navbar_avatar分享
repo_avatar
HelloGitHub 评分
10.0
1 人评分
多格式文档解析和导出工具
开源MIT
认领
收藏
分享
56.8k
星数
中文
Python
主语言
活跃
1
贡献者
866
Issues
组织
2.82.0
最新版本
4k
Forks
MIT
协议
更多
docling image
这是一个由 IBM 开源的 Python 工具,专门用于将各类文档转化为适合生成式 AI 使用的格式。它能够将 PDF、DOCX、PPTX、图片、HTML、Markdown 等多种流行文档格式,导出为 Markdown 和 JSON 格式,支持多种 OCR 引擎(PDF)、统一的文档对象(DoclingDocument),轻松集成检索增强生成(RAG)和问答应用,适用于需要将文档作为生成式 AI 模型输入的场景。
收录于:
第 115 期
标签:
Python

评论

评分:
暂无精选评论