我需要根据页码将一个PdfFileReader文件拆分成几个对象,以便使用getFormTextFields()从特定页面提取数据。有没有一种方法可以做到这一点,而不是为每个页面创建新的PDF文档。
发布于 2021-06-07 14:28:43
from PyPDF2 import PdfFileReader
pdf_document = "example.pdf"
with open(pdf_document, "rb") as filehandle:
pdf = PdfFileReader(filehandle)
info = pdf.getDocumentInfo()
pages = pdf.getNumPages()
print (info)
print ("number of pages: %i" % pages)
page1 = pdf.getPage(0)
print(page1)
print(page1.extractText())
发布于 2021-06-07 14:45:30
from PyPDF2 import PdfFileWriter, PdfFileReader
inputpdf = PdfFileReader(open("document.pdf", "rb"))
for i in range(inputpdf.numPages):
output = PdfFileWriter()
output.addPage(inputpdf.getPage(i))
with open("document-page%s.pdf" % i, "wb") as outputStream:
output.write(outputStream)
https://stackoverflow.com/questions/67866832
复制相似问题