我编写了一个从PDF文档中提取文本的程序。但一份PDF文件给了我空的短信。我可以在Acrobat中打开PDF文件,它可以正常工作。我的代码可以很好地处理其他PDF文件,所以我想知道是什么导致了这个问题。我用了PyPDF2和PyPDF2,但结果是一样的。所以这个文件一定有问题: from PyPDF2 import PdfReader for page in reade
我有一个pdf文件,是在肖像方向,但在一些页面,文本是在景观方向。当使用PyPDF2读取上面的页面时,我从extractText()函数获得以下文本:Out24:"U ~ 00 w.T.-O.O.O.mó00 woNN p 00 a+ -fl n~n a O ;~ 0 ~^ o a. ~…
下面是我试图提取文本的页面示例: