用于IndirectObject提取的pyPdf

、、、、

我尝试用PyPDF2和pdfminer.six提取元数据，得到了：info = pdf.getDocumentInfo()获取响应： {'/Title': IndirectObject(38, 0), '/Author': IndirectObject(40, 0), '/Subject': IndirectObject

浏览 0提问于2019-07-10得票数 0

1回答

从IndirectObject提取信息的pyPdf

、、

我正在写一个脚本，将读取pdf文件的创建和修改日期。我正在使用Python中的pyPdf包from pyPdf import PdfFileWriter, PdfFileReader 此代码返回 {'/Producer': IndirectObject(185, 0)

浏览 1提问于2015-10-01得票数 0

1回答

我正在尝试使用PyPDF2模块从一个pdf文档中读取文本。当我在页面对象上调用extractText()函数时，它会对某些pdfs造成此错误。这是我调用函数之后的追溯。我阅读的所有pdfs都可以选择/搜索文本。不幸的是，我不能给出pdfs的任何例子。File "C:\Python39\lib\site-packages\PyPDF2\pdf.py", line 2595, in extractText content = ContentStream(

浏览 5提问于2022-10-05得票数 0

3回答

、、、

import pyPdflist(pdf.pages) # Process all the objects.现在，我需要从pdf文件中提取一个非标准对象。我的对象是名为MYOBJECT的对象，它是一个字符串。python脚本打印出来的让我担心的内容是： {'/MYOBJECT

浏览 3提问于2009-01-12得票数 12

回答已采纳

5回答

使用Python获取PDF附件

、

我们必须处理带有附件或注释附件的PDF文件。我试图使用PyPDF2库从PDF文件中提取附件。import PyPDF2 电话是：handle

浏览 19提问于2021-06-22得票数 0

2回答

/Rotate中的pyPdf IndirectObject

、、

在我遇到一个IndirectObject作为页面上的/Rotate键值的文件之前，所有的pyPdf都运行得很好。中的IndirectObject。我甚至尝试将相同的IndirectObject传递给rotateClockwise，它会抛出相同的回溯，这是pdf.pyc中之前的一行代码我的问题很简单，就是。。。有没有针对pyPdf或PyPDF2的

浏览 5提问于2013-12-18得票数 1

1回答

无论页数如何，pyPdf输出文件的大小都是相同的

、、、

我正在尝试使用pyPdf从一个大的pdf文件中提取几页到一个单独的文件中。每当我这样做时，结果文件大小几乎与源文件相同。我认为这与文件中的书签有关，因为如果页面不包含任何链接，则输出文件的大小会非常小。我不知道如何从输出文件中排除书签。from pyPdf import PdfFileWriter as writer, PdfFileReader as readerr = reader(open('9.pdf_objects # p

浏览 0提问于2012-02-16得票数 1

2回答

如何使用PyPDF2提取目录？

、

我能用PyPDF2做类似的事情吗？

浏览 4提问于2018-01-09得票数 3

回答已采纳

2回答

PyPDF2 :提取目录/大纲及其页码

、、、

我正在尝试提取目录/大纲从PDF和他们的页码使用Python (PyPDF2)，我知道reader.outlines，但它没有返回正确的页码。：https://www.annualreports.com/HostedData/AnnualReportArchive/l/NASDAQ_LOGM_2018.pdf reader.outlines的输出是to Stockholders', '/Page'

浏览 90提问于2021-07-16得票数 1

回答已采纳

1回答

在python解释器中键入对象的名称--它是什么方法？

、、、

当我键入对象的名称时，会调用什么方法？我一直认为这是在调用repr或str，但这在PageObject of PyPDF2的情况下并不成立。如您所见，__repr__或__str__的输出与我们在交互控制台中键入变量的名称时得到的输出不同。__str__() "{'/Annots': [], '/Contents': IndirectObject(12, 0), '/Group&

浏览 1提问于2019-09-30得票数 2

回答已采纳

1回答

用Python (PyPDF2)在pdf中选中复选框

、、、

许多/Btn都有/Kids -- /kids是以"indirectObject“形式出现的其他复选框。另外，我无法在此pdf中选择/修改普通复选框(示例如下)from PyPDF2 import PdfFileReader, PdfFileWriter '

浏览 19提问于2022-06-08得票数 0

3回答

使用python PyPDF2从PDF中提取图像

、、、、

有没有办法从pdf文档(使用库)中将图像提取为流？另外，是否可以将一些图像替换为另一个图像(例如，使用PIL生成或从文件中加载)？>>> import PyPDF2>>> reader = PyPDF2.PdfFileReader(open('sample.pdf', 'rb')){&#x

浏览 0提问于2013-12-02得票数 15

1回答

PyPDF2:从压缩文件中读取pdf

、、

我正在尝试让PyPDF2读取一个简单的压缩文件中的小.pdf文件。这是我到目前为止所得到的： filename = z.namelist()[0] b = z.open(filename) PyPDF2.PdfFileReader

浏览 16提问于2020-05-28得票数 1

回答已采纳

1回答

在PDF文件中嵌入文档

、、

我们希望在创建的PDF文档中存储一些特定于应用程序的元数据( JSON对象)。我们尝试使用canvas.setKeyword和PdfFileReader.documentInfo"/Keywords“有没有其他方法可以用reportlab将文件嵌入到PDF文档中？有没有其他方法可以用PyPDF2把它读回来？

浏览 1提问于2015-05-15得票数 1

1回答

使用PyPDF2检测Google Docs生成的PDF文件中未嵌入的字体

、、、、

我希望有人能帮我写一个Python函数来检测文件中没有嵌入到文件中的任何字体。我尝试使用脚本链接的here，它可以检测文档字体，但它不能检测嵌入的字体。为了方便起见，我粘贴了下面的脚本： from PyPDF2 import PdfFileReader fontkeys = set(['/FontFile', '/FontFile2，Adobe Reader已经确认该字体是嵌入的。我已经在其他的PDF上试过了，而且

浏览 28提问于2020-03-27得票数 1

回答已采纳

1回答

pdfminer错误消息:不允许提取pdfminer.pdfdocument.PDFTextExtractionNotAllowed:文本

、、

我需要处理一些PDF文件，并在数据库中添加它们的表单域内容。我尝试了我找到的的建议。使用PyPDF2时，我得到错误消息：“文件尚未解密”。

浏览 41提问于2021-02-23得票数 0

1回答

PyPDF2使用update_page_form_field_values()后不显示条形码(pdf417)

、、

我试着修改这里找到的pdf pager = reader.getPage单独运行此代码段，但不能直接更新GivenName字段 from PyPDF2 import Pdf

浏览 27提问于2022-08-29得票数 1

1回答

PyPDF2对pdf表单所做的更改不会显示

、、、

我正在使用python库pypdf2。我正在使用python版本3.10.6。在vscode中，我有一个扩展，它允许我查看pdfs，在那里它显示了我所做的更改，但是在mac的预览窗口中，它没有，也在safari中。代码：import osfrom PyPDF2 import PdfReader, PdfWriter fromPyPDF2.generic import BooleanObject, NameObject

浏览 2提问于2022-10-04得票数 2

6回答

使用pyPDF从文档中检索页码

、

目前，我正在考虑做一些与pyPdf的PDF合并，但有时输入的顺序不正确，所以我会考虑抓取每页的页码来确定它应该进入的顺序(例如，如果有人将一本书分成20个10页的PDF，我想把它们放在一起)。我知道有时页码存储在文档数据中的某个地方，就像我见过的在Adobe上呈现为类似的PDF，但我将这种类型的文档读取到pyPDF中时，我找不到任何指示页码的信息--它存储在哪里？2.)如果avenue #1不可用，

浏览 2提问于2012-09-11得票数 24

回答已采纳

2回答

如何使用PyPDF2旋转页面？

、

我正在用pyPDF2编辑一个PDF文件。我成功地生成了我想要的PDF，但是我还没有旋转一些页面。Python说：要产生此错误，请执行以下操作：

浏览 8提问于2017-03-06得票数 8

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用PyPDF2读取PDF元数据

从IndirectObject提取信息的pyPdf

用PyPDF2从pdf中提取文本