腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
从
pdfs和文档中提取
文本
和元
数据
javascript
、
python
我想知道如何
从
文档such as bold text or big titles中提取
文本
和相关元
数据
的方法。那么,我如何
从
文件中提取所需的
数据
呢?
浏览 11
提问于2020-10-22
得票数 0
回答已采纳
1
回答
Azure机器学习无法将
PDF
作为web服务的输入
azure
、
azure-machine-learning-studio
这些文档是
PDF
格式的。当我将这个实验部署为web服务时,它不允许我输入
PDF
。有没有一种方法可以将
PDF
输入到web服务?
浏览 0
提问于2017-02-06
得票数 1
4
回答
Python
3-
从
PDF
中进行
数据
挖掘
python
、
python-3.x
、
pdf
、
toolkit
、
foxit
我正在做一个需要从
PDF
文档
中
获取
数据
的项目。 目前,我
使用
Foxit toolkit (
从
脚本调用它)将文档转换为txt,然后迭代它。我对此相当满意,但100$,这只是一个我负担不起的小项目。我已经测试了我能找到的所有免费转换器(比如xpdf,pdftotext),但是它们就是不切断它,它们在某种程度上搞砸了格式,以至于我无法用单词来定位
数据
。我尝试过一些
Python
模块,比如pdfminer,但是它们在
Python
3
中<
浏览 6
提问于2016-08-17
得票数 4
1
回答
如何在windows上将
pdf
转换为
文本
?
windows
、
transform
、
pdftotext
我有一个扫描的
pdf
,我想把它转换成一个可编辑的
文本
格式。你有什么建议可以在Windows上做到这一点吗?我在考虑
使用
Linux作为Windows的一个子程序。还有其他想法吗?
浏览 15
提问于2019-11-15
得票数 0
1
回答
如何
从
使用
xlwt创建的excel文件创建
pdf
python
、
excel
、
pdf
、
xlwt
我正在创建MS Excel格式的报告,并一直
使用
xlwt和
python
中
的相关模块为用户提供服务。我在想,也许我可以把xlwt保存到StringIO,然后再转换成
PDF
?有没有能做到这一点的
python
模块? 我有什么选择?
浏览 1
提问于2012-03-03
得票数 2
1
回答
PDF
数据
的提取与挖掘
etl
我有一个
pdf
档案(入学申请)。我想读取/搜索
pdf
和提取具有类似含义的术语,然后将这些
数据
转换为DataFrame以保存为xlsm文件。帮助!
浏览 0
提问于2020-01-08
得票数 2
1
回答
无法追加PyCharm文件
python
、
pycharm
我是一个新手程序员,我正在为一个游戏编写这个帐户工具(只对我自己来说,现在只能在控制台上运行它)来做这件事我需要一个
数据
库,但我所做的是用我的类创建一个
Python
文件,另一个是交互式的,它必须将你键入的一些东西附加到另一个
Python
文件
中
,这个文件包含这个类,所以它会自动保存这两个文件。然而,在我的程序结束时(不仅仅是上面的代码),它就会停止,因为我需要它重新启动,或者至少给我一个重新启动/退出的选项,我必须
使用
while循环,所以一开始我尝试
使用
while循环,然后我这样
浏览 12
提问于2018-01-22
得票数 0
1
回答
使用
python
从
pdf
中
获取
文本
数据
python
、
nlp
、
pdf-scraping
我在这里遇到了如何处理
pdf
的问题。我不知道如何直接
从
网络上抓取,而且当我在本地下载时,它们完全是胡说八道,而不是真正的
文本
数据
。 我试着用请求下载,但内容是无用的。): with open('/Users/derricdonehoo/code/derric-d/price-processor/exmpl.
pdf
', 'wb') as f:
浏览 10
提问于2019-06-24
得票数 1
回答已采纳
4
回答
使用
python
处理
pdf
中
的表
python
、
pdf
、
pdf-scraping
我正在写一个
pdf
文件。在该
pdf
中有许多表格。我做过html,xlm解析,但从来没有用过
pdf
。谁能告诉我如何
使用
python
从
pdf
中
获取
表格?
浏览 3
提问于2012-03-20
得票数 5
2
回答
用
Python
将
PDF
文件转换为
文本
文件
python
、
python-2.7
、
pdf
、
text
、
converter
我已经花了好几天的时间在网上研究如何
从
pdf
文件
中
获取
特定的信息。最终,我能够
使用
Python
从
文本
文件
中
获取
所有信息(我通过转到
PDF
文件-> file ->文件 问题是如何让
Python
完成这些任务(打开
PDF
文件(打开它-非常容易打开(“文件路径”),点击菜单
中
的File,然后将文件保存为同一个目录
中
的
浏览 3
提问于2016-07-21
得票数 3
回答已采纳
15
回答
如何
使用
pdfminer作为库
python
、
pdf
、
pdfminer
我正在尝试
使用
从
pdf
中
获取
文本
数据
。我能够
使用
pdfminer命令行工具
pdf
2txt.py成功地将这些
数据
提取到.txt文件
中
。我现在这样做,然后
使用
python
脚本来清理.txt文件。我想将
pdf
提取过程合并到脚本
中
,并为自己节省一步。 ,但我在任何解决方案上都没有成功。也许这里列出的函数需要再次更新,因为我
使用<
浏览 9
提问于2011-04-20
得票数 74
回答已采纳
2
回答
将
pdf
文件转换为excel表格
c#
、
asp.net
、
excel
、
pdf
我是.net的新手,我有一个包含三个表的
pdf
(与购买细节)我的任务是提取所有的3个表
从
pdf
和转换成一个excel表(三个excel表)
使用
c#代码。,我谷歌了3天,所有我能找到的是
从
pdf
中提取
文本
的代码(但没有任何格式),我不能购买任何第三方工具,我需要一种方法,至少提取
文本
在适当的表格格式,然后我会转换成excel
使用
互操作,或一个代码直接转换成
浏览 5
提问于2013-09-29
得票数 1
4
回答
PDF
-将单个单词拆分为单独的行-
Python
3
python
、
pdf
、
text
、
pdfminer
我正在尝试将
PDF
中
的单词提取到单独的行
中
,但只能对
文本
文件执行此操作,如下所示。 此外,规则是我不能将
PDF
文件转换为TXT,然后执行此操作。必须对
PDF
文件执行此操作。我也需要对可搜索的
PDF
文件做同样的事情。任何帮助都将不胜感激。
浏览 66
提问于2019-12-06
得票数 0
回答已采纳
1
回答
用PyPDF2
获取
复选框和无线电字段
python
、
python-3.x
、
pypdf2
、
pdfminer
我的项目涉及
从
使用
开源库的一堆
PDF
表单文件
中
读取
文本
。在
获取
以下
文本
数据
方面没有问题:cnt = len(reader.pages) print("reading
pdf
(%d pages我只得到普通
文本
(例如Yes No或Check-1 Check-2 Check-3 ),而不
浏览 6
提问于2022-08-23
得票数 0
1
回答
使用
python
从
pdfs中提取特定
文本
pymupdf
、
pdfplumber
、
grobid
我尝试过不同的
python
库来
从
pdfs中提取特定的
文本
,我必须从这个
pdf
中提取标题下的
文本
,我必须将从例1开始的
文本
提取为菱形粗体。 下一个
pdf
包含不同格式的的
数据
。在这个
pdf
中
,我必须
从
历史提取
数据
到检查,然后
从
检查到调查与历史和调查作为一个excel文件
中
的列和相应的
数据
行。
python
regex
浏览 20
提问于2022-06-30
得票数 0
3
回答
用
Python
将ppt文件转换为pptx
python
、
python-2.7
、
powerpoint
目标:I需要从.ppt文件中提取表格
中
的
文本
(列名为名称、地址、联系电话、电子邮件等)。为此,我遵循了以下方法: 解析.pptx文件的xml以
获取
格式化
文本<
浏览 3
提问于2017-08-14
得票数 8
1
回答
转换
PDF
文件为XML文件,最好
使用
ITextSharp
c#
、
xml
、
pdf
、
itext
我有一个
PDF
文档,我需要从中读取
数据
。我发现,当我将上述
PDF
转换为XML文档时,可以
从
其中读取方便的标记,因此我需要一种方法来在代码中将我的文件转换为xml,这样我就可以
使用
映射文件将
数据
内容读取到
数据
库
中
。
浏览 2
提问于2012-06-22
得票数 3
1
回答
DocuSign和Manage Desk Plus集成
rest
、
api
、
docusignapi
这将是我第一次
使用
API。到目前为止,我一直在
使用
Postman的POST功能从SDP中提取我需要的信息。我还
使用
了相同的函数来创建信封和
使用
DocuSign发送信封。如果还有其他我能提供的信息,请
浏览 11
提问于2018-07-30
得票数 0
1
回答
如何
获取
导入到
Python
中
的
文本
并创建CSV文件?
python
、
csv
、
pdfminer
你好(提前道歉,编程新手,尽我最大努力)我已经
使用
PDFMiner将
pdf
文档导入到
Python
中
,它会将
PDF
中
的所有
文本
粘贴到
Python
中
。有没有一种简单的方法可以用导入的
文本
创建CSV文件?
从
Python
中
以不同的格式
获取
这些
数据
的最好方法是什么?我用来导入<
浏览 11
提问于2021-02-14
得票数 0
1
回答
创建空文件
javascript
、
jspdf
我试图通过
使用
jspdf返回空文件
pdf
从
我的动态HTML(在这里我
从
表
中
获取
数据
,而只
从
DB
获取
文本
)来实现。<script> var
pdf
= new jsPDF();
浏览 3
提问于2020-12-03
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python教程|如何批量从大量异构网站网页中获取其主要文本?
如何使用DNS和SQLi从数据库中获取数据样本
如何用Python从PDF文件中提取文本词汇
使用 Python 获取 QQ 群投票数据
使用带外数据从电子表格获取数据
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券