腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
在
python
中将
pdf
文件
转
换为
txt
文件
的
Web
抓取
python
、
web-scraping
我尝试了几种方法来获取美联储
的
新闻发布会记录(
PDF
格式),并将其转
换为
.
txt
文件
,但都失败了。下面是我
的
原始代码。任何建议都将受到高度赞赏。div",attrs={"id","content"}): fileout = open('conf.
txt
浏览 20
提问于2020-06-27
得票数 1
1
回答
将cp1251
pdf
解析为
python
中
的
文本
python
、
parsing
、
pdf
、
cp1251
有什么方法可以用俄文(cp1251)从
pdf
文件
中提取文本吗? 对于解析
pdf
文件
,我使用pdfminer包。我试图
在
pdfminer.converter.TextConverter类
的
参数中指定编码,但没有帮助。
浏览 7
提问于2015-08-26
得票数 1
回答已采纳
3
回答
如何使用
python
将
txt
文件
或
PDF
转
换为
Word文档?
python
、
pdf
、
ms-word
、
converter
有没有办法
在
python
中将
PDF
(或文本
文件
)转
换为
Word文档?我正在为我
的
教授做一些网络搜索,原始文档是
PDF
。我将其中
的
1,611个
文件
转
换为
文本
文件
,现在我们需要将它们转
换为
Word文档。我唯一能找到
的
是一个Word-to-
txt
转换器,而不是相反
的
。 谢谢!
浏览 2
提问于2015-03-28
得票数 2
回答已采纳
1
回答
如何使用tesseract
python
3读取一个目录中
的
所有
pdf
文件
并转
换为
文本
文件
?
python
、
tesseract
如何使用tesseract
python
3读取一个目录中
的
所有
pdf
文件
并转
换为
文本
文件
? 下面的代码用于读取一个
pdf
文件
并转
换为
文本
文件
。但我想读取目录中
的
所有
pdf
文件
,并使用tesseract
python
3
转
换为
文本
文件
。os
pdf
_filename =
浏览 33
提问于2019-06-18
得票数 0
2
回答
从网页中提取pdfs并转
换为
html
python
、
xpath
、
scrapy
、
pdf-extraction
、
pdfminer
我
的
目标是拥有一个
python
脚本,它将访问特定
的
网页,提取每个页面上所有
在
文件
名中有特定单词
的
pdf
文件
,将它们转
换为
html/xml,然后遍历html
文件
从pdfs
的
表中读取数据。到目前为止,我已经导入了机械化(用于浏览页面/查找
pdf
文件
)和pdfminer,但是我不知道如何在脚本中使用它来执行命令行中
的
相同功能。对于完
浏览 2
提问于2014-02-18
得票数 0
回答已采纳
1
回答
使用R将
PDF
转
换为
csv
r
有没有办法
在
R
中将
PDF
转
换为
csv?Xpdf允许
在
R中转
换为
txt
,如下所示: system(paste('"C:/Program Files/Xpdf/pdftotext.exe"', '"C:/Documents and Settings/rM/Desktop/club.
pdf
"'), wait=F
浏览 1
提问于2014-02-08
得票数 0
1
回答
使用Scrapy下载
PDF
文件
python
、
session
、
cookies
、
scrapy
我正在使用一个
Python
web
抓取
框架Scrapy从一个网站
抓取
pdf
文件
。为什么会这样&你知道如何克
浏览 1
提问于2011-11-13
得票数 0
1
回答
PDF
Google文档查看器
pdf
、
seo
、
indexing
我使用谷歌文档
在
我
的
网站上显示嵌入
的
PDF
。它像这样使用iframe: <iframe src="http://docs.google.com/viewer?url=http%3A%2F%2Fwww.emathhelp.net%2Fpdf%2F1%2F1331155133.
pdf
&embedded=true" width="800" height="500"style="border: non
浏览 1
提问于2012-04-28
得票数 0
回答已采纳
1
回答
幽灵脚本是如何将
PDF
转换成.
txt
的
?
pdf
、
converter
、
ocr
、
ghostscript
Ghostscript能够
在
终端
中将
pdf
文件
转
换为
.
txt
(文本
文件
)。我在想它是怎么完成这个任务
的
?我不是
在
寻找一个非常重要
的
解释,但只是一个正确
的
方向推动(链接到指南等也会做到这一点)。 谢谢!
浏览 2
提问于2016-07-08
得票数 0
回答已采纳
1
回答
用
Python
调用Inkscape
python
、
pdf
、
svg
、
inkscape
可能重复: 我试图
在
Python
中将
SVG
文件
转
换为
PDF
。我想用Inkscape来做这个。如何在
Python
中调用Inkscape?
浏览 1
提问于2012-07-25
得票数 9
2
回答
将所有
PDF
文件
转
换为
目录中
的
文本
python
我
在
我
的
终端上执行这个命令来转换
文件
它运行得很好,现在我想把这个函数嵌入到我
的
简单
Python
脚本中。我想转换一个目录上
的
所有
PDF
文件
files = [ '
浏览 1
提问于2013-05-11
得票数 2
2
回答
用
Python
将
PDF
文件
转
换为
文本
文件
python
、
python-2.7
、
pdf
、
text
、
converter
我已经花了好几天
的
时间在网上研究如何从
pdf
文件
中获取特定
的
信息。最终,我能够使用
Python
从文本
文件
中获取所有信息(我通过转到
PDF
文件
-> file ->
文件
问题是如何让
Python
完成这些任务(打开
PDF
文件
(打开它-非常容易打开(“
文件
路径”),点击菜单中
的
File,然后将
文件
保存为同一个目录中
的
浏览 3
提问于2016-07-21
得票数 3
回答已采纳
3
回答
在
PYTHON
文件
夹
中将
多个
pdf
转
换为
txt
python-3.x
我尝试了以下代码,但它只转换
文件
夹中
的
最后一个
pdf
: import fitz # this is pymupdfos.chdir('C:/Users/XXXXXXX')for file in glob.glob("*.
pdf
"): text = "" text +
浏览 40
提问于2020-10-01
得票数 0
3
回答
ps2
pdf
从paps创建
的
ps
文件
创建一个非常大
的
pdf
文件
linux
、
bash
、
command-line
、
pdf-generation
、
postscript
在
linux中,我使用ps2
pdf
在
bash脚本
中将
文本
文件
report转
换为
pdf
。以前,我使用a2ps将文本转
换为
ps,然后馈送到ps
浏览 21
提问于2014-09-27
得票数 0
1
回答
将
pdf
的
字符串表示形式转
换为
python
中字节
的
某种方法
python
、
python-3.x
、
pdf
、
flask
、
byte
我实际上是
在
尝试做一些我不知道是否可以
的
事情。我有一个
web
客户端和一个
web
服务器,服务器(用
python
编写
的
烧瓶)处理一个
pdf
文件
以获取一些数据,客户机只发送
pdf
文件
并等待响应。我认为客户端可以发送各种
pdf
文件
进行处理,我想做
的
是,
在
一个请求
中将
所有pdfs从客户机发送到服务器。data converted
浏览 1
提问于2018-09-06
得票数 2
回答已采纳
1
回答
Adobe Acrobat中多个
文件
转换
的
Javascript失败
javascript
、
adobe
、
acrobat
我正在尝试
在
Adobe
中将
多个
文件
从
PDF
转
换为
纯文本。我在网上找到了一个解决方案,上面写着: this.saveAs("C:\Users\sandr\Dropbox\Light\Doctorate\Supervisormeetings\2018\October\Method\test_corpus\2sleep.tar\2sleep\2sleep\
pdf
\
txt
_output&q
浏览 0
提问于2018-12-13
得票数 0
2
回答
对
文件
夹中
的
所有
文件
运行命令
的
Python
脚本
python
、
pdf
、
text
、
data-analysis
、
pdfminer
为了将
pdf
转
换为
文本,我使用以下命令:但我有超过1000个
pdf
文件
,我需要转
换为
文本
文件
,然后进行分析。有什么方法可以让我使用这个命令来迭代
pdf
文件
并转换所有这些
文件
呢
浏览 4
提问于2015-06-03
得票数 1
回答已采纳
1
回答
循环中有多个不同
的
命令
ansible
我正在尝试将一个yml
文件
转换成json。我需要从file1.
txt
中选择yml
文件
列表,并将所有这些
文件
转
换为
json。下面是我使用
的
代码 tasks: shell: cat /home/testadmin.json content: "{{ result.stdout | from_yaml | to_nice_json
浏览 4
提问于2019-01-17
得票数 0
1
回答
如何在Django
中将
.
pdf
文件
的
格式转
换为
.
txt
python
、
django
、
django-models
、
pypdf2
我正在开发一个Django
web
应用程序,在那里我想将.
pdf
和.docx
文件
转
换为
.
txt
。我编写了一个save()函数,其中我想获取
文件
,然后将其转
换为
.
txt
格式。但它给了我一个错误: 我<e
浏览 0
提问于2021-08-09
得票数 0
1
回答
无法执行
pdf
2
txt
.py
python
、
python-2.7
、
pdfminer
尝试
在
windows环境中使用pdfminer将
pdf
文件
转
换为
txt
,请参阅:C:\
python
Tools\
pdf
2
txt
.py -o test.
txt
sample.
pdf
ImportError: No modulenamed pdfminer.pdfdocument 我尝试
浏览 5
提问于2017-03-15
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
想知道怎么把pdf转txt文件的方法吗 来试试这两种方法
方法交你了,最全格式转换Word、Excel、PDF、CAD
pdf转换txt怎么转?这样转换很简单
PDF转换TXT,分享好用的转换方法
PDF转TXT,分享好用的转换方法
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券