可以把 PDF 文件变成可搜索文件的工具5它使用 Tesseract OCR 引擎,将 PDF 的内容识别成文本,然后给 PDF 文件增加 OCR 文本层。从而实现可搜索和复制 PDF 的内容,已支持 100 多种语言。ocrmypdf·Python·1 年前1.4w
允许对 PDF 文件做各种操作的 Web 应用这是一款功能强大、开箱即用的 PDF 工具,支持拆分/合并文件、添加/提取图片、压缩、加水印、添加/删除密码等功能,满足你对 PDF 文件的所有需求。Stirling-Tools·Java·7 个月前6.3k
免费小巧的开源 PDF 阅读器这是一款免费、小巧、速度快、中文的 Windows PDF 阅读工具,它拥有日常所需的所有功能和简约大方的界面,支持查看 PDF、epub、mobi、cbz、CHM 等文件,这一切不多不少刚刚好。sumatrapdfreader·C·1 年前1.8k
可将 PDF 转换成 docx 文件的 Python 库该项目通过 PyMuPDF 库提取 PDF 文件中的数据,然后采用 python-docx 库解析内容的布局、段落、图片、表格等,最后自动生成 docx 文件。ArtifexSoftware·Python·2 年前1.7k
《PDF 解析》该项目是《PDF Explained》一书的非官方中文翻译版,内容由浅入深介绍了如何构建简单的 PDF 文件,以及 PDF 运算符、书签、超链接、注释、加密等高级特性。zxyle·Other·3 个月前1.2k
全能的 PDF 工具箱多功能的 PDF 工具箱,可用于修改 PDF 文件信息。支持: - 修改、合并 PDF 文档 - 自动生成书签 - 书签编辑器 - 高速无损地导出文件中的图片 - 等等 wmjordan·C#·2 年前845
功能更强大的处理 PDF 文件的 Python 库用于读取和写入 PDF 文件的 Python 库 ```python import pikepdf with pikepdf.open('input.pdf') as pdf: num_pages = len(pdf.pages) del pdf.pages[-1] pdf.save('output.pdf') ``` pikepdf·Python·2 年前641
将 PDF 转换为 Markdown 文件的项目这是一个能够将 PDF、EPUB 和 MOBI 格式的文件转换为 Markdown 文件的 Python 项目。相较于 Nougat,它具有更快的速度和更高的准确度,在处理英语类内容时效果最佳,但对中文的处理就要差一些。VikParuchuri·Python·1 个月前536