项目详情
由
分享


HelloGitHub 评分
10.0
1 人评分
开源•MIT
认领
讨论
收藏
分享
37.2k
星数
否
中文
Python
主语言
是
活跃
118
贡献者
524
Issues
是
组织
2.48.0
最新版本
3k
Forks
MIT
协议
更多

这是一个由 IBM 开源的 Python 工具,专门用于将各类文档转化为适合生成式 AI 使用的工具。它能够将 PDF、DOCX、PPTX、图片、HTML、Markdown 等多种流行文档格式,导出为 Markdown 和 JSON 格式,支持多种 OCR 引擎(PDF)、统一的文档对象(DoclingDocument),轻松集成检索增强生成(RAG)和问答应用,适用于需要将文档作为生成式 AI 模型输入的场景。
标签:
Python
评论
评分:
暂无精选评论