腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
如何
使用
python
将
给定
的
PDF
文件
提取
为
文本
和
表格
,
并将
数据
存储
在
.
csv
文件
中
?
、
、
、
我需要
提取
第一个表
的
账号、分行名称等,以及最后一个表
的
日期、描述和金额。
pdf
文件
:
使用
pypdf2库获取空白输出
的
https://drive.google.com/file/d/1b537hdTUMQwWSOJHRan6ckHBUDhRBbvX/view?import PyPDF2 file_path =open(r"E:\user\programs\28_oct_bank_statement\de
浏览 30
提问于2021-10-28
得票数 0
1
回答
将
PDF
中
的
文本
提取
为
JSON或XML或其他格式?
、
、
我试图从
PDF
中
提取
数据
,价格,信息和数字(我有超过10000个
PDF
,所以网站
的
免费试用将不起作用)。下面是我得到
的
一个
PDF
示例:我用
Python
语言(这类任务
的
初学者,还有
Python
语言)
和
几个包(如PyPDF2、pdfx等等)尝试过,但我只能得到这样
的
文本
所以可以
提取
价格,数字
浏览 2
提问于2019-01-01
得票数 0
2
回答
如何
在itextSharp
中
检测表启动?
、
、
、
、
我正在尝试
将
pdf
转换为
csv
文件
。
pdf
文件
具有
表格
格式
的
数据
,第一行
为
标题。我已经可以从单元格中
提取
文本
,比较
表格
中
文本
的
基线,并检测换行符,但我需要比较
表格
边框来检测
表格
的
开始。我不知道
如何
检测
和
比较
PDF
中
浏览 2
提问于2013-04-02
得票数 3
回答已采纳
1
回答
如何
使用
aws从文档中
提取
服务
和
.net导出
CSV
表格
、
、
我试图
使用
AWS
的
DetectDocument (异步)从
PDF
文件
中
提取
表格
和
数据
,
使用
的
是C#/.NET。我在
数据
提取
方面很成功,但我不知道
如何
使用
AnalyzeDocument
提取
PDF
中
的
表格
并导出到
CSV
文件
中<
浏览 21
提问于2019-09-03
得票数 1
回答已采纳
3
回答
从
pdf
文件
中
获取
数据
、
我有一张
pdf
文件
中
的
表格
。有x,y,z列。我只想要x列。有可能
使用
python
吗?如果是,怎么做? 然后我想要画x
和
y。我该怎么做(
使用
表
中
的
数据
)
浏览 23
提问于2022-04-14
得票数 -1
8
回答
PDF
表格
提取
、
、
我
将
(相同
的
)
数据
保存为GIF图像
文件
和
PDF
文件
,并希望将其解析
为
HTML或XML。这些
数据
实际上是我校食堂
的
菜单。这意味着有一个新版本
的
文件
,必须分析每周!通常,
文件
包含一些页眉
和
页脚
文本
,以及一个包含其他
数据
的
表。我阅读了一些关于堆栈溢出
的
文章,并开始尝试
将</
浏览 10
提问于2012-04-24
得票数 12
1
回答
如何
像Chrome浏览器那样
使用
Python
从
PDF
中
提取
文本
?
、
、
我正在尝试从
pdf
文件
中
提取
文本
(类似于表单)。目前,我
在
Chrome上打开
文件
,选择/复制所有
文本
,将其粘贴到txt
文件
中
,然后
使用
Python
将其处理
为
CSV
。Chrome让我
的
数据
非常结构化
和
统一,这样
pdf
的
每一页都会产生类似的
文本
块,让我
浏览 35
提问于2021-06-16
得票数 0
2
回答
如何
循环浏览web
表格
列并
使用
Automation下载多个
PDF
文件
?
我有一个HTML表,它有七列
和
三行(行数可能或多或少)。第二列包含指向
PDF
文件
的
链接,第七列包含短语“纠正行动”,我只想从包含单词“更正行动”
的
列中下载
PDF
文件
。但是,我
的
代码只是下载第一个
PDF
。这是表: 能帮我处理一下这个吗?
浏览 0
提问于2019-04-29
得票数 0
回答已采纳
2
回答
从excel
csv
文件
中
读取特定行/列
、
、
、
我是
python
的
初学者,我希望从.
csv
电子
表格
中
取三个特定
的
列,从某一行开始,然后
将
每个列导入
Python
。 任何帮助都将不胜感激。
浏览 12
提问于2015-06-01
得票数 0
4
回答
使用
R进行
PDF
抓取
、
、
、
我已经成功地
使用
了XML包来
提取
HTML表,但我想扩展到
PDF
。如果做不到这一点,
在
Python
(我是一个完全
的
新手)中有什么方法可以获得
和
操作
pdf
,这样我就可以用R XML包来完成这项工作了吗
浏览 10
提问于2011-10-27
得票数 10
回答已采纳
2
回答
有没有办法用
python
把.
pdf
转换成.
csv
?
、
我目前正在尝试tabula-py,但我
在
提取
pdf
数据
时尝试
的
所有文档示例都导致了以下错误: returned non-zero exit status 1。因此,我很好奇是否有其他方法可以
使用
python
将
pdf
表格
中
的
数据
转换为
csv
文件
。
浏览 0
提问于2020-05-24
得票数 0
6
回答
从一组HTML
文件
中
提取
表格
内容
的
最佳方法是什么?
、
、
、
、
使用
TIDY清理完一个满是HTML
文件
的
文件
夹后,
如何
提取
表格
内容以进行进一步处理?
浏览 6
提问于2008-09-16
得票数 1
回答已采纳
3
回答
提取
文本
并
使用
python
保存
、
、
、
、
如何
从
PDF
文件
中
提取
以下
PDF
格式
的
文本
。PyPDF2不以适当
的
可读格式
提取
文本
。我研究过PyPDF2
和
Pandas。两者都能够
提取
数据
,但
数据
存储
为
1列。我需要以这种所需
的
格式
将
提取
的
数据
存储</e
浏览 12
提问于2022-06-14
得票数 0
回答已采纳
3
回答
php
中
的
pdf
文本
提取
器类
、
、
有没有任何可用
的
类,
在
php中
提取
所有的
文本
从
pdf
文件
,以便我可以
存储
在
mysql
数据
库
中
。我
的
pdf
有许多元素,如图像,
表格
,纯
文本
,表单元素,图表等。到目前为止,我在过去
的
两天里看到了许多
提取
文本
的
类,但没有一个促进完整
的
文本
浏览 1
提问于2011-06-29
得票数 2
回答已采纳
1
回答
图像保留结构
中
的
翻译语言
、
、
我们希望
将
pdf
文档
中
的
图像从不同
的
语言转换为英语。它们是扫描过
的
图像,很多时候都有
表格
或一些结构。我们希望翻译成英语,但尽可能保留文档
的
结构。因此,仅仅基于纯
文本
的
翻译是不够
的
。我们
在
安卓上看到了谷歌翻译应用程序,它似乎对phone..is上
的
照片做了类似的事情,还有一个谷歌云应用程序接口,它也做了同样
的
事情?为了
在
Googl
浏览 6
提问于2021-07-21
得票数 0
2
回答
解压缩
PDF
表格
,
Python
3,tabula-py
、
、
正在尝试
使用
Python
3.6从
PDF
中
提取
表格
。似乎pyPDF2失败了,pdfminer与3.x不兼容。我找到了tabula
的
python
包装器。import tabulaprint(text) tabula.convert_into(file_list[0], "test.json&qu
浏览 1
提问于2017-04-20
得票数 4
6
回答
如何
在
python
中
创建一个简单
的
pdf
文件
?
、
我正在寻找一种方法来输出一个非常简单
的
pdf
文件
从
Python
。基本上,它将由两列单词组成,一列是俄语(即utf-8字符),另一列是英语。我已经用谷歌搜索了大约一个小时,我找到
的
包要么是大量
的
夸大其词(仍然没有提供有用
的
例子),比如ReportLab,要么似乎认为任何人对
pdf
唯一做
的
事情就是将它们
中
的
几个连接在一起(PyPdf,pdfrw也许我只是遗漏了一些明显
的
东西,但我看到<
浏览 0
提问于2012-08-05
得票数 23
回答已采纳
1
回答
如何
使用
Tika或任何其他库从
PDF
文件
中
提取
数据
并以
CSV
/excel格式
存储
、
、
、
我想要
提取
PDF
文件
中
的
数据
,并以
CSV
/Excel格式表示,我知道可以
使用
java.But
中
的
Tika库来实现,我确实找到了
如何
将
数据
提取
为
简单
文本
的
解决方案,但我想知道
如何
将其
存储
在
excel表
中
。如果有人以
浏览 5
提问于2016-03-26
得票数 0
回答已采纳
7
回答
如何
从
CSV
文件
导入
数据
并将
其
存储
在
变量
中
?
、
、
、
、
我对
python
3非常陌生,我在这里学习。我想有人可以帮我解决一个基本问题:
如何
将
CSV
文件
中
的
文本
作为变量
存储
在
代码
的
后面。因此,这里
的
想法是
将
CSV
文件
导入
python
解释器:with open('some.
csv
',
浏览 11
提问于2014-05-28
得票数 2
回答已采纳
2
回答
有关photoshop、excel
和
外部图像
的
难题
、
、
是的,我有一个photoshop PSD
文件
,一个填充了自定义
数据
的
电子
表格
和
一个装满图片
的
文件
夹。我想为电子
表格
中
的
每个条目创建唯一
的
图像,其中电子
表格
包含必须填充PSD
中
的
文本
元素
的
数据
,并引用需要粘贴到photoshop
中
的
图像。我通常会手动完成此操作
浏览 4
提问于2010-02-16
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券