我正在尝试使用PyPDF2模块从一个pdf文档中读取文本。当我在页面对象上调用extractText()函数时,它会对某些pdfs造成此错误。这是我调用函数之后的追溯。我阅读的所有pdfs都可以选择/搜索文本。不幸的是,我不能给出pdfs的任何例子。File "C:\Python39\lib\site-packages\PyPDF2\pdf.py", line 2595, in extractText
content = ContentStream(
我正在尝试使用pyPdf从一个大的pdf文件中提取几页到一个单独的文件中。每当我这样做时,结果文件大小几乎与源文件相同。我认为这与文件中的书签有关,因为如果页面不包含任何链接,则输出文件的大小会非常小。我不知道如何从输出文件中排除书签。from pyPdf import PdfFileWriter as writer, PdfFileReader as readerr = reader(open('9.pdf_objects
# p