腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
wget
和
PDFFileReader
-
无法
读取
格式
错误
的
PDF
文件
python
、
pdf
、
web-scraping
、
wget
、
pypdf2
我正在尝试从希腊卫生部
的
每日报告中抓取新冠肺炎
的
数据,这些数据以
PDF
格式
发布在网上。我使用
wget
下载它们,然后使用PyPDF2从它们抓取数据: import
wget
wget
.download('https://eody.gov.gr/wp-content/uploads/2020/09/covid-gr-daily-report-23-09-2020.<
浏览 24
提问于2021-01-21
得票数 0
回答已采纳
1
回答
Python
PDF
完整性检查
python
、
pdf
我有一个
pdf
的
库(大多数都有一些随机压缩
的
东西,还有djvu
的
)。其中一些
pdf
已经损坏,应该删除。 有没有什么办法可以在python中做
pdf
完整性检查?
浏览 0
提问于2012-04-07
得票数 1
3
回答
如何覆盖Python当前正在
读取
的
文件
python
、
pdf
、
input
、
overwrite
我不太确定这样做
的
最好方法,但我想做
的
是,
读取
pdf
文件
,进行各种修改,并将修改后
的
pdf
文件
保存在原始
文件
上。到目前为止,我能够保存修改后
的
pdf
到一个单独
的
文件
,但我希望取代原来,而不是创建一个新
的
文件
。(file('input.
pdf
', 'rb')) blank
浏览 0
提问于2010-05-01
得票数 3
回答已采纳
1
回答
ValueError:在PyPDF2上对关闭
的
文件
进行查找,并收到此
错误
python
、
python-3.x
、
pypdf2
我正在尝试从
pdf
文件
中获取文本。代码如下: from PyPDF2 import
PdfFileReader
pdf
=
PdfFileReader
(file) #print(dir(page)) print(page.extractText()) 这给了我一个
错误
Valu
浏览 181
提问于2019-05-05
得票数 5
回答已采纳
3
回答
将seek添加到filetype对象
的
廉价方法
python
、
file
、
urllib
、
file-type
PdfFileReader
从
pdf
文件
中
读取
内容以创建对象。从通过url下载
的
pdf
文件
创建
PdfFileReader
对象
的
简单方法是什么? 现在,我可以做些什么来避免通过file()再次
浏览 0
提问于2010-04-16
得票数 2
回答已采纳
1
回答
TypeError:字符串索引必须是pdfreader中
的
整数
python
运行此代码时read_bikeins =
pdf
.
PdfFileReader
(bikeins)
文件
"",第1行,在read_bikeins =
浏览 1
提问于2018-02-27
得票数 0
4
回答
PyPDF2 IOError:[Errno 22]关于PyPdfFileReader Python2.7
的
无效论证
python
、
python-2.7
、
pypdf
目标=打开
文件
,加密
文件
,写入加密
文件
。Traceback (most recent call last): File "CommissionSecurity.py",
浏览 2
提问于2015-11-21
得票数 1
回答已采纳
1
回答
PdfReadWarning:
PdfFileReader
流/
文件
对象未处于二进制模式
python-2.7
、
pypdf
我有很多
pdf
页面,我想把它们合并成一个
文件
。我
的
脚本如下:filename_list=[]for(filename) merger.append(
PdfFileReader
(open(filename),'rb')) merger.write('output.
浏览 6
提问于2014-04-01
得票数 9
3
回答
读取
目录中
的
所有
PDF
(图像)
python
、
pdf
、
operating-system
、
pypdf2
我附上了一张图片,以帮助展示我所做
的
事情。我正在尝试编写一个程序,该程序将添加一个空白页到目录中具有奇数页
的
所有
PDF
。然而,我似乎
无法
读取
一个目录中
的
所有
PDF
。我有一个单一
的
PDF
的
脚本工程,但我有1000
的
这些要做
的
。为什么我
无法
读取
user_input目录下
的
所有
PDF
文件
?代码在这里
浏览 3
提问于2017-02-06
得票数 0
1
回答
打印到
pdf
文件
中每页第一行
的
excel
python
、
python-3.x
、
csv
、
pdf
、
pypdf2
我是python
的
新手,只有一个用来在pdfs中搜索字符串
的
脚本。现在,我想建立脚本,这将给我在新
的
CSV/xlsx
文件
的
结果,在那里我将有给定
的
pdf
文件
的
第一行和他们
的
页码。现在,我有下面的代码来打印整个页面: from PyPDF2 import
PdfFileReader
pdf
_document = "example.
pdf
&quo
浏览 26
提问于2020-11-06
得票数 0
1
回答
遍历目录时
的
字数统计
PDF
文件
python
、
pdf
、
word-count
、
os.walk
、
pdf-reader
我正在尝试构建一个Python程序,它将遍历一个目录(以及所有子目录),并对所有.html、.txt
和
.
pdf
文件
进行累计字数统计。当
读取
.
pdf
文件
时,它需要一些额外
的
东西(
PdfFileReader
)来解析
文件
。在解析.
pdf
文件
时,我得到以下
错误
,程序停止: AttributeError:'
PdfFileReader
‘对象没有'start
浏览 36
提问于2018-03-06
得票数 1
回答已采纳
3
回答
PdfFileReader
: PdfReadError:
无法
在指定位置找到xref表
python
、
pypdf2
我试图通过以下方法
读取
python中
的
Pdf
文件
:test_reader =
PdfFileReader
(file("test.
pdf
", "rb"))PyPDF2.utils.PdfReadError: Could not find xref table at specified location
浏览 7
提问于2015-12-05
得票数 6
回答已采纳
1
回答
可编辑
的
pdf
文件
无法
使用pypdf2
读取
python
、
pdf
、
pypdf2
、
pdf-reader
我有
pdf
文件
,这是可编辑
的
意思是当我打开
pdf
时,我可以选择
和
更改
pdf
格式
的
下拉选项。这个
pdf
我试图通过pypdf2模块
读取
,但没有任何东西作为输出。你们能让我知道我如何阅读
和
把输出从可编辑
的
pdf
到json
格式
。感谢在advance.As中,你可以在屏幕截图中看到,打开
pdf
文件
后,我们改变了数据。我尝
浏览 5
提问于2020-07-06
得票数 0
1
回答
如何使用PyPDF2从上传到Google App Engine
的
PDF
中提取文本?
google-app-engine
、
python-2.7
、
pypdf
有没有办法从通过谷歌应用程序引擎上传
的
PDF
文件
中提取文本
和
documentInfo?我想使用PyPDF2,我
的
代码是:
pdf
_reader = pypdf.
PdfFileReader
(
pdf
_file)Traceback (most recent call last): ....File
浏览 4
提问于2014-01-13
得票数 0
3
回答
如何在python中从
文件
夹中逐个
读取
pdf
文件
python
、
pdf
我正在阅读
pdf
文件
,并试图通过NLP techniques.Right从它们提取关键字,现在程序一次只接受一个
pdf
。我在D盘上有一个
文件
夹,叫做'
pdf
_docs‘。该
文件
夹包含许多
pdf
文档。我
的
目标是从
文件
夹中一个接一个地
读取
每个
pdf
文件
。我如何在python中做到这一点。到目前为止成功运行
的
代码如下所示。import PyPDF2 file
浏览 3
提问于2018-10-28
得票数 0
回答已采纳
1
回答
pyPdf
错误
无效参数
python
、
file
、
pdf
、
pypdf
、
invalid-argument
实际上,我正在使用pyPdf打开、
读取
和
写入
PDF
文件
的
内容。为此,我使用以下几行代码:content =
pdf
.getPage(1).extractText() pr
浏览 1
提问于2012-05-23
得票数 6
1
回答
OSX中
的
pyPDF IOError异常
python
、
pypdf
我正在尝试使用
PdfFileReader
从pyPdf模块打开一个
pdf
(名为kalimera.
pdf
),使用以下一组命令我得到以下
错误
: Traceback (most recent call last):File "&
浏览 1
提问于2016-02-09
得票数 0
2
回答
PyPDF2中仍然存在"
PDF
文件
尚未解密“问题
python-3.x
、
pdf
、
encryption
、
pypdf2
在使用PyPDF2
读取
PDF
文件
时出现以下
错误
raise utils.PdfReadError("File has not been decrypted") PdfReadError: File hasnot been decrypted 我一直在尝试通过python以编程方式
读取
PDF
文档。对于大多数
PDF
文件
,它工作得很好,但对于少数
文件
,我得到以下
错误
raise utils.PdfRea
浏览 288
提问于2019-02-12
得票数 3
回答已采纳
1
回答
如何
读取
亚洲语言(中文、日文、泰文等)
的
PDF
文件
并将字符串存储在python中。
python
、
unicode
、
nlp
、
text-extraction
、
pdf-reader
我使用PyPDF2
读取
python中
的
PDF
文件
。虽然它适用于英语
和
欧洲语言
的
语言(英文字母),但图书馆
无法
阅读亚洲语言,如日语
和
汉语。我尝试过其他库,如textract
和
PDFMiner,但都没有成功。 当我从
PDF
中复制文本并将其粘贴到笔记本上时,字符就会变成一些随机
格式
的
文本(可能是以不同
的
编码方式)。def convert_
pdf
_to_
浏览 1
提问于2018-06-22
得票数 4
回答已采纳
1
回答
无法
使用Python3.x: DependencyError: PyCryptodome算法查找
PDF
的
页数
python-3.x
、
encryption
我正在对从url下载
的
文件
执行数据验证。其中一个验证检查涉及检查
PDF
的
页数。使用PyPDF2包
和
PdfFileReader
模块,直到我遇到一个具有权限密码但没有打开密码
的
256位AES加密
的
PDF
。我
无法
访问任何密码,因为这些
文件
来自制造商网站,所以我
的
结论是,目前我只需检查
PDF
是否加密,如果是的话,暂时跳过它,但不管我是否试图检索页面计数或检查
PDF
浏览 9
提问于2022-08-29
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
用python操作PDF文件
用Python实现一款永久免费的PDF编辑工具
你还在傻傻花钱编辑pdf格式?咋不用Python?(和猫妹学Python)
聊聊 python 操作PDF的几种方法
使用Python编写PDF小工具的实现方法
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券