腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
如何
强制
pdfplumber
根据
上面
行
的
列
数
提取
表格
?
python
、
pdf
我正在尝试用python包
pdfplumber
从PDF文档中
提取
一个表。该表有四
列
和多行。第一
行
是标题,第二
行
只有一个合并
的
单元格,然后值被正常保存(例如)
pdfplumber
能够检索
表格
,但如果有四
列
,它会生成6
列
,并
根据
列
保存值。我尝试使用不同
的
表格
设置,包括“垂直策略”:“线”,但这产生了相同
的
结果。# Python 2
浏览 47
提问于2019-10-09
得票数 0
2
回答
如何
使用
pdfplumber
将表详细信息
提取
到
行
和
列
中
python
、
pandas
、
dataframe
、
pdfplumber
我正在使用
pdfplumber
从pdf中
提取
表格
。但是,正在使用
的
表没有可见
的
垂直线分隔内容,因此
提取
的
数据被分成3
行
和1
列
。 ? 我想把
上面
的
表格
排成13
行
。import
pdfplumber
import numpy as np with
pdfplumber
.open('test.p
浏览 67
提问于2021-08-21
得票数 0
2
回答
水管工认不出桌面巨蟒
python
、
tabular
、
pdf-extraction
我使用Pdf管道工
提取
第2页第3节中
的
表格
(通常)。但它只适用于一些pdf,而另一些则不起作用。对于失败
的
pdf文件,它似乎Pdf管道工阅读按钮表,而不是我想要
的
表格
。工作
的
pdf连结:import
pdfplumber
pdf =
pdfplumber
.open("/Users/chueckingmok&
浏览 10
提问于2020-07-20
得票数 3
1
回答
水管工错过了原理图中所有表
的
第一
列
和最后一
行
。
python
、
pdfplumber
我是新来
的
水管工,我惊讶于它是
如何
从
表格
中
提取
文本
的
。它无法
提取
文档中每个表
的
第一
列
和最后一
行
。我试图调整table_settings变量中
的
几个配置参数,不幸
的
是,我没有能够获得更好
的
结果(在我
的
例子中,如果我使用"tex
浏览 13
提问于2021-11-22
得票数 0
回答已采纳
1
回答
如何
在PDF文件中找到
表格
网格线?
python
、
pdf-extraction
、
python-camelot
、
pymupdf
、
pdfplumber
为了更准确地
提取
表单元格中嵌入
的
类似
表格
的
数据,我希望能够识别PDF中
的
表单元格边界,如下所示:我已经尝试使用Camelot、
pdfplumber
和PyMuPDF来
提取
这样
的
表,并取得了不同程度
的
成功但由于我们收到
的
PDF格式不一致,即使在指定
表格
边界时,我也无法可靠地获得准确
的
结果。 我发现,如果我通过显式指定单元格边界来单独
提取
每个
表格</
浏览 12
提问于2021-03-04
得票数 0
3
回答
添加新数据时Excel表不展开
excel
、
vba
我有一个Excel电子
表格
,在同一个选项卡上包含四个数据表。每
列
中
的
最后3
列
包含公式。但是,对于第一个表,数据被粘贴进去,但表不会展开,因此,公式不会添加到表外
的
行
中。 我到处寻找固定
的
东西,但没有任何乐趣。我搜索了数据<
浏览 3
提问于2013-11-13
得票数 2
1
回答
数组公式,省略某些
列
并合并
arrays
、
if-statement
、
google-sheets
、
google-sheets-formula
、
array-formulas
我正在处理一个表,其中我需要
根据
行
"Type“
提取
某些
列
的
内容。例如,如果
行
3
的
版本为"Type 1",那么我需要从该行
提取
列
1、3和5。我需要为第2
列
和第4
列
放置一个"x“。我已经创建了一个数组公式,可以让我知道需要
提取
哪些
列
,但我不知道
如何
按需要
的
顺序将数据合并到一
列
浏览 29
提问于2020-05-18
得票数 0
2
回答
多个Excel电子
表格
导入到R
r
我有一个包含数百个电子
表格
的
Excel文件。 11111 | 2813A | Whatever | 100 11111 | 7721CD 因此,正如您在
上面
看到
的
,数字
的
五位
数<
浏览 0
提问于2017-03-03
得票数 1
1
回答
子报表上
的
SQL Server Reporting Services 2005
列
自动换行
reportingservices-2005
有没有人知道
如何
设置子报表
的
高度和宽度,以便
强制
子报表分成几列? 分界:我必须在
表格
报表上方
的
页眉中有限
的
空间中显示图例,并且我希望限制图例
的
高度,以便
根据
需要将其包装到多
列
中。例如,子报表可能是从包含8个项
的
数据集中
提取
的
:1-红色、2-蓝色、3-紫色、4-绿色、5-黄色、6-橙色、7-棕色、8-黑色。我希望将子报
表格
式化为3
列
/3<
浏览 4
提问于2009-06-12
得票数 0
回答已采纳
1
回答
单元格跨越动态生成
的
表
的
所有
列
html
、
internet-explorer
对于我
的
应用程序中
的
一个显示页面,我正在生成几个动态表,它们
的
列计数
根据
特定
的
业务逻辑而变化。但是,我需要有一个横跨整个表
的
"title“
行
。 但有趣
的
是,它在兼容性视图中工作得很好(这几乎与它在opera中
的
显示方式相同
浏览 0
提问于2011-09-08
得票数 1
3
回答
PostgreSQL select查询中
的
最大
列
数
是多少
sql
、
postgresql
、
postgresql-9.2
您知道在Postgresql中可以查询
的
最大
列
数
吗?在开始我
的
项目之前,我需要知道这一点。
浏览 6
提问于2012-09-27
得票数 47
回答已采纳
2
回答
计算OpenDocument电子
表格
中
的
列
数
(ODS文件)
c#
、
xml
、
xmldocument
、
ods
、
opendocument
我在C#中创建了一个非常简单
的
应用程序,它使用和XmlDocument类读取文件。由于格式化和样式与我
的
应用程序无关,所以这是相对直接
的
。该格式包括与此问题相关
的
几个元素( <table:table-column>、<table:table-row>、<table:table-cell>和<table:covered-table-cell即使考虑了
列
的
重复,
列
元素
的
数量也不一定与电子
表格
中<e
浏览 4
提问于2013-09-01
得票数 0
回答已采纳
2
回答
使用VBA合并Excel工作表
vba
、
excel
我有一个Excel
表格
(比如OG.xls),其中已经有一些数据,其中有大约5000
行
,第一
行
有标题,最多有"AN“
列
。行数(5000)在一整年内都不会改变。现在我有5个XL文件(比如A、B、C、D、E),这些文件中
的
数据每次都必须从第500
行
开始添加到这个OG文件中。这5个文件
的
列
数
不同,但与OG文件
的
列
数
相同。我必须从这些文件中
提取
数据,并将其放入OG
浏览 4
提问于2008-10-23
得票数 2
1
回答
是否有excel公式可以从混合数据
列
的
最后25
行
中
提取
数字?
excel-formula
是否有excel公式可以从混合数据
列
的
最后25
行
中
提取
数字?
行
可以是十进制
数
,也可以是N/A
浏览 0
提问于2018-07-10
得票数 0
2
回答
如何
在谷歌单张中按字长排序,然后按字母顺序排列?
google-sheets
、
sorting
我有一个本地JavaScript函数来对我描述
的
方式进行排序: })['bar', 'baz', 'foo', 'bing',
浏览 0
提问于2022-10-26
得票数 1
回答已采纳
1
回答
如何
在JRxml文件中创建动态
列
以生成jasper报表?
jasper-reports
我有一个数据集,使用jasper report以
表格
格式显示,目前正在编写.jrxml文件。TEST_ID LEVEL
浏览 1
提问于2012-11-01
得票数 7
1
回答
列
跨度可以在html中浮动吗?
html
我在
表格
中有一个
列
,它应该是
上面
一
行
的
2.5英寸宽,有没有可能一旦我给出了这么多
的
宽度
提取
,
上面
一
行
的
第一
列
就不会受到影响?
浏览 1
提问于2011-08-17
得票数 0
1
回答
Python中
的
Regex不返回任何内容(使用regex时搜索参数关键字用于搜索)
python
、
regex
我不太确定regex是
如何
工作
的
,但我正在尝试做一个项目(还没有设置它,但首先使用一个test pdf在代码
的
pdf索引方面)来分析标记方案pdf,并在此基础上对有用
的
数据做任何事情。我正在尝试迭代或遍历每一
行
的
开头1-2位
数
(问题
列
),然后使用re.compile(r'\d{1} [A-D]')在以下代码中使用A(答案
列
):import requests import
pdfplumb
浏览 1
提问于2022-05-21
得票数 0
回答已采纳
1
回答
如何
使用
PDFPlumber
从两
列
PDF中
提取
文本
python
、
text-extraction
、
topic-modeling
、
information-extraction
、
pdfplumber
我正在使用python进行主题建模任务,我想从年度/可持续性报告中
提取
文本。然而,我
的
问题是,当我试图
提取
报告时,摘录
的
线条在一页中
的
两
列
之间被分开,即它将相邻段落中
的
两
行
连接起来,形成一个句子。我
如何
准确地
提取
报告中所显示
的
线条。我已附上该报告
的
版本和该函数
提取
的
线条。下面是我使用
的
函数: #函数从url中获取pdf
浏览 5
提问于2021-08-25
得票数 2
3
回答
表-布局:修正忽略td
的
最小宽度
css
、
css-tables
、
tablelayout
我有一个项目,它需要一个包含固定宽度和灵活宽度
列
的
表。通过添加表布局:min;在表中,我能够获得所有宽度相等
的
灵活宽度cols,但是,然后该表忽略td
的
最小宽度属性。如果我删除表
的
布局:固定
的
,最小宽度工作,但灵活宽度科尔都有不同
的</
浏览 14
提问于2011-08-10
得票数 19
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券