首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何根据页码将单个pdf拆分成多个PdfFileReader对象?

如何根据页码将单个pdf拆分成多个PdfFileReader对象?
EN

Stack Overflow用户
提问于 2021-06-07 14:24:33
回答 2查看 25关注 0票数 0

我需要根据页码将一个PdfFileReader文件拆分成几个对象,以便使用getFormTextFields()从特定页面提取数据。有没有一种方法可以做到这一点,而不是为每个页面创建新的PDF文档。

EN

回答 2

Stack Overflow用户

发布于 2021-06-07 14:28:43

代码语言:javascript
运行
复制
from PyPDF2 import PdfFileReader

pdf_document = "example.pdf"
with open(pdf_document, "rb") as filehandle:
    pdf = PdfFileReader(filehandle)
    info = pdf.getDocumentInfo()
    pages = pdf.getNumPages()

    print (info)
    print ("number of pages: %i" % pages)

    page1 = pdf.getPage(0)
    print(page1)
    print(page1.extractText())
票数 0
EN

Stack Overflow用户

发布于 2021-06-07 14:45:30

代码语言:javascript
运行
复制
from PyPDF2 import PdfFileWriter, PdfFileReader

inputpdf = PdfFileReader(open("document.pdf", "rb"))

for i in range(inputpdf.numPages):
    output = PdfFileWriter()
    output.addPage(inputpdf.getPage(i))
    with open("document-page%s.pdf" % i, "wb") as outputStream:
        output.write(outputStream)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67866832

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档