项目详情
由
分享


HelloGitHub 评分
9.6
5 人评分
开源•MPL-2.0
认领
讨论
收藏
分享
26.6k
星数
是
中文
Python
主语言
是
活跃
105
贡献者
126
Issues
是
组织
16.10.0
最新版本
2k
Forks
MPL-2.0
协议
更多

它使用 Tesseract OCR 引擎,将 PDF 的内容识别成文本,然后给 PDF 文件增加 OCR 文本层。从而实现可搜索和复制 PDF 的内容,已支持 100 多种语言。
评论
评分:
暂无精选评论