项目详情
由分享
HelloGitHub 评分
0 人评分
开源•MIT
认领
讨论
收藏
分享
9.4k
星数
否
中文
Python
主语言
是
活跃
18
贡献者
59
Issues
是
组织
2.5.2
最新版本
445
Forks
MIT
协议
更多
这是一个由 IBM 开源的 Python 工具,专门用于将各类文档转化为适合生成式 AI 使用的工具。它能够将 PDF、DOCX、PPTX、图片、HTML、Markdown 等多种流行文档格式,导出为 Markdown 和 JSON 格式,支持多种 OCR 引擎(PDF)、统一的文档对象(DoclingDocument),轻松集成检索增强生成(RAG)和问答应用,适用于需要将文档作为生成式 AI 模型输入的场景。
标签:
Python
评论
评分:
暂无精选评论