问如何根据页码将单个pdf拆分成多个PdfFileReader对象？
EN

Stack Overflow用户

提问于 2021-06-07 14:24:33

回答 2查看 25关注 0票数 0

我需要根据页码将一个PdfFileReader文件拆分成几个对象，以便使用getFormTextFields()从特定页面提取数据。有没有一种方法可以做到这一点，而不是为每个页面创建新的PDF文档。

python

pypdf2

回答 2

Stack Overflow用户

发布于 2021-06-07 14:28:43

from PyPDF2 import PdfFileReader

pdf_document = "example.pdf"
with open(pdf_document, "rb") as filehandle:
    pdf = PdfFileReader(filehandle)
    info = pdf.getDocumentInfo()
    pages = pdf.getNumPages()

    print (info)
    print ("number of pages: %i" % pages)

    page1 = pdf.getPage(0)
    print(page1)
    print(page1.extractText())

票数 0

Stack Overflow用户

发布于 2021-06-07 14:45:30

from PyPDF2 import PdfFileWriter, PdfFileReader

inputpdf = PdfFileReader(open("document.pdf", "rb"))

for i in range(inputpdf.numPages):
    output = PdfFileWriter()
    output.addPage(inputpdf.getPage(i))
    with open("document-page%s.pdf" % i, "wb") as outputStream:
        output.write(outputStream)

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/67866832

复制

相似问题

问如何根据页码将单个pdf拆分成多个PdfFileReader对象？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何根据页码将单个pdf拆分成多个PdfFileReader对象？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何根据页码将单个pdf拆分成多个PdfFileReader对象？
EN