OCRmyPDF—可以把 PDF 文件变成可搜索文件的工具5它使用 Tesseract OCR 引擎,将 PDF 的内容识别成文本,然后给 PDF 文件增加 OCR 文本层。从而实现可搜索和复制 PDF 的内容,已支持 ocrmypdf·Python·2 years ago1.4w
Umi-OCR—开源、免费的 OCR 图片转文字识别软件这是一款完全免费的 OCR 软件,支持离线使用、截屏识别文字、批量导入图片、横/竖排文字,还可以忽略水印区域,适用于 Windows 操作系统。hiroi-sora·Python·2 years ago7.6k
Text-Grab—一个轻量级的 Windows OCR 工具1它基于 Windows 10 系统自带的 OCR API 实现,可以将看到的所有文字转化成文本,而且启动速度快、无需常驻后台、可离线使用。TheJoeFin·C#·2 years ago1.1w
tesseract—一款“老当益壮”的 OCR 引擎这个项目最早诞生于 1985 年,几经易主在 2005 年的时候 HP 将其开源。目前,Tesseract 已经成为 OCR 领域 Star 数最多的开源项目,tesseract-ocr·C++·2 years ago3.6k