腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
忽略
来自
PDFMiner
的
错误
以
避免
Python
脚本
中断
、
、
我目前已经安装了
PDFminer
.six,并且已经测试了几个从PDF文件中提取文本
的
功能。我还有另一个函数,它接收PDF文件列表,然后调用第一个PDF提取函数来提取每个文件中
的
所有文本。问题是,我有很多PDF文件,
脚本
似乎每次遇到新
的
错误
都会崩溃。无论是无法识别的字符、不同
的
编码或加密等,都很难找到导致
错误
的
PDF文件。 我
如何
才能让
脚本
继续运行,而不管
错误
的
类型
浏览 69
提问于2019-04-30
得票数 1
1
回答
使用带空格
的
pdfminer
提取pdf
、
、
我正在尝试从pdf中提取文本,这是多次讨论
的
,但我仍然无法提取pdf,保留单词之间
的
空白。$
python
3[GCC 6.2.1 20160901 (Red Hat 6.2.1-1)] on linuxpdf2txt.py '/var/tmp/acs%2Eaccounts%2E6b00452.pdf'| morepubs.acs.org/acco
浏览 5
提问于2016-11-17
得票数 1
2
回答
安装了两个pythons
的
python
导入语句
在我
的
Windows7笔记本电脑上,我安装了
Python
2和
Python
3,我一直在它们之间来回切换,比如py -2 myscript.py等等。我通过使用
pdfminer
显式地安装了一个名为pip2
的
包,并且我已经验证它在我
的
磁盘上C:\
Python
27\Lib\site-packages\
pdfminer
上 但是,当我试图运行一个
脚本
时,我会得到一个
错误
文档中所提供
的
完全相同,我甚至将
P
浏览 0
提问于2018-05-09
得票数 0
回答已采纳
4
回答
pdfminer
- ImportError:没有名为
pdfminer
.pdfdocument
的
模块
、
我
的
主机(pair.com)向我提供了以下信息
以
帮助完成此任务: 安装以使用上面的帐户空间,而不尝试安装Writing /usr/home/username/
pdfminer
/lib/
python
/
浏览 12
提问于2016-03-09
得票数 9
回答已采纳
5
回答
Pdfminer
python
3.5
、
、
、
、
我已经完成了一些教程,但是我无法运行这个代码块,我完成了从StringIO到BytesIO
的
必要切换(我相信?)NameError: name 'file' is not definedfrom io import BytesIO from
pdfminer
.pdfinterp代码<e
浏览 3
提问于2016-10-04
得票数 21
回答已采纳
1
回答
路径不打印字符串值
、
我最近发现了这个非常方便
的
pdf转换库。我正在尝试将pdf转换成字符串值。以便解析数据并转换为csv文件。我想为将
来自
动化这一点,所以我不能使用Tabula。用于字符串转换
的
部分无法工作。(pdf2string.py)这里是pdf转换成字符串
的
一部分。from
pdfminer
.converter
浏览 6
提问于2016-05-13
得票数 0
回答已采纳
1
回答
如何
在循环中
忽略
输入[
Python
]
、
我正在尝试弄清楚
如何
在
Python
中
忽略
来自
循环
的
输入。 下面的代码是一个简单
的
Python
代码,它接受数字输入作为若干个循环,并在一个循环中打印一个字符。print(x) time.sleep(1) 但是,如果在循环进行(循环)过程中从键盘输入内容并按enter,则此值将成为下一个循环主循环
的
输入我
的
问题是
如何
避免
这种情况,或者
忽略</e
浏览 17
提问于2021-01-31
得票数 2
回答已采纳
2
回答
使用textract
的
pdftotext
、
、
当我在包含PDF文件
的
目录上运行下面的
Python
脚本
时,我一直收到以下
错误
: ShellError:命令pdftotext "path/to/pdf/title.pdf" -失败了退出代码1我已经验证了pdf2text和
PDFMiner
的
安装是否正确。当pdftotext是实际
的
库时,为什么要调用pdf2text?
浏览 0
提问于2015-04-08
得票数 7
3
回答
长时间运行
python
脚本
、
、
我有以下几个部分
的
应用:而且一些
python
脚本
可能会运行很长时间(2-6分钟)。
脚本
执行后,我应该给客户端内容,但连接
中断
与
错误
“网关超时504”。对于我
的
案例,我可以使用什么来
避免
此
错误
?
浏览 5
提问于2012-01-31
得票数 0
1
回答
Django:通过选择对象
的
名称从admin运行
脚本
、
、
、
、
我使用Django 1.8和
Python
2.7.8创建一个带有MySQL数据库
的
web接口,我只需使用Admin页面来操作不同
的
表。假设我有一个带有字段
的
学生对象:名称、id和性别。
如何
实现这样
的
功能: 我只需要
来自
Python
程
浏览 1
提问于2015-09-01
得票数 0
回答已采纳
1
回答
UnicodeDecodeError在NLTK
的
word_tokenize中,尽管我强制编码
、
、
、
、
我得到了这个
错误
,尽管我试图解码(‘utf-8’).encode(‘utf-8’)
的
纯文本,事先。在回溯过程中,我注意到word_tokenize()中首先引发
错误
的
代码行是plaintext.split('\n')。这就是为什么我试图通过在纯文本上运行拆分(‘\n’)来再现
错误
的
原因,但是,这也不会导致任何
错误
。任何帮
浏览 5
提问于2014-08-14
得票数 3
回答已采纳
2
回答
安装和编译
Python
、Django、Virtualenv、Mercurial、Git、LessCSS等
的
脚本
。梦之神论
、
、
、
、
我发现
的
所有教程和片段似乎过于简单,假设(或
忽略
)
Python
需要大量
的
依赖项才能正确编译所有模块。因此,从开始(到目前为止,我发现了最好
的
指南),我决定编写一个设置并忘记Bash
脚本
来自
动化这个痛苦
的
过程,其中包括我计划使用
的
其他一些东西。剧本TODOs人 到目前为止,它运行良好,并在大约900秒内完成了所需
的
所有操作,在整个过程结束时给了我一个功能齐全
的
<e
浏览 2
提问于2010-05-26
得票数 6
回答已采纳
5
回答
如何
抑制特定函数
的
Java编译器警告
、
、
、
、
我们总是被教导要确保我们在开关语句中使用一个
中断
,以
避免
失败。然而,编译器会发出大量
的
警告,这些警告可能掩盖了我需要知道
的
警告。我知道
如何
将编译器更改为
忽略
所有失败警告,但我希望在逐方法
的
基础上实现这一点,以
避免<
浏览 7
提问于2009-02-27
得票数 28
回答已采纳
1
回答
检查变量存在
的
gdb命令。
、
、
、
在GDB
脚本
中,
如何
检查堆栈变量是否存在?< No symbol "variable" in current context > 我想知道是否有一个gdb命令来检查变量是否存在?
浏览 0
提问于2014-08-14
得票数 2
2
回答
无法读取可在线获得
的
pdf文件中特定页
的
内容
、
、
、
、
我已经使用库在本地解析一个pdf文件
的
任何特定页面的内容,并发现它可以工作。但是,当我试图应用相同
的
逻辑,同时解析在线可用
的
pdf文件
的
任何特定页面的内容时,我会遇到一个
错误
。doc = fitz.open(path)page1text = page1.getText("text")下面的
脚本
引发一个
错误
(可在线获得
的
pdf): import fi
浏览 0
提问于2019-08-16
得票数 3
回答已采纳
1
回答
忽略
Python
异常,然后在子模块代码中直接继续
、
我使用一个
python
库,它抛出一个已知
错误
的
异常。事实上,最近
的
一个拉请求建议只删除抛出异常
的
行。if '<img class="icon meh" src="
浏览 0
提问于2019-05-31
得票数 1
回答已采纳
3
回答
如何
用Java测试IO问题?
、
、
如何
在不使用睡眠
的
模拟流(因为它们会对
中断
作出反应)
的
情况下测试应用程序代码
的
行为,以防止IO性能非常差? 例如,我想测试一个具有文件IO线程池
的
ConcurrentWrapper实用程序。它将每个操作提交给具有超时
的
ExecutorService和invokeAll()。我不仅要确认带有ConcurrentWrapper
的
调用在超时之前退出,还想确认它以某种方式使其内部ExecutorService
的
线程终止(以
避免</em
浏览 1
提问于2012-06-04
得票数 0
1
回答
当“哪个
python
”没有显示
python
的
位置时,我该怎么办?
、
which
python
什么也没有显示。下面的命令修复了问题但这是一个共同
的
、安全
的
解决方案吗?which
python
/usr/bin/
python
浏览 0
提问于2019-07-12
得票数 3
回答已采纳
2
回答
$
python
-bash: /usr/local/bin/
python
:没有这样
的
文件或目录
、
、
在运行重写文件
的
脚本
后,
Python
以
某种方式
中断
了。每当我使用它时,我都会得到这个
错误
:-bash: /usr/local/bin/
python
: No such file or directory$ brewunlink
python
&& brew link
python
$ b
浏览 0
提问于2017-09-12
得票数 9
回答已采纳
15
回答
如何
使用
pdfminer
作为库
、
、
我能够使用
pdfminer
命令行工具pdf2txt.py成功地将这些数据提取到.txt文件中。我现在这样做,然后使用
python
脚本
来清理.txt文件。我想将pdf提取过程合并到
脚本
中,并为自己节省一步。 ,但我在任何解决方案上都没有成功。也许这里列出
的
函数需要再次更新,因为我使用
的
是较新版本
的
pdfminer
。我尝试过
的
另一种方法是使用os.system在
脚本
中调用
脚本
。这也是不成功
的</
浏览 9
提问于2011-04-20
得票数 74
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券