我编写了一个从PDF文档中提取文本的程序。但一份PDF文件给了我空的短信。我可以在Acrobat中打开PDF文件,它可以正常工作。我的代码可以很好地处理其他PDF文件,所以我想知道是什么导致了这个问题。我用了PyPDF2和PyPDF2,但结果是一样的。所以这个文件一定有问题: from PyPDF2 import PdfReader
我有PDF文件,我想发送到智能手机作为jpg的,但我想保留图像,文本格式等。我发现一些工具转换PDF的图像,但大多数不会渲染它首先在智能手机上可读。我发现的一个软件可以将eBook转换成适合智能手机的图像( PDF to Images),它使用字符识别并重写PDF (你会丢失任何图像或格式)。有没有一种方法可以将PDF转换为要在移动设备上查看的图像?
谢谢!
我正在编写一个脚本,它可以“读取”PDF文件,然后自动重命名它从字典中识别的文件。然而,对于某些PDF,PyPDF2只返回空行,而对于其他PDF则可以很好地工作。读取文件的代码:file = 'sample.pdf'
with open(file, "rb") as f:\n\\n\\n'"
奇怪的是,当我用Ad