如何查找camelot的表区域

、、

我正在使用Camelot来阅读完整的PDF，并从每个PDF中提取约112个属性。我使用表区来提取属性 test_variable = camelot.read_pdf(filename, flavor='stream', table_areas=['38, 340 ,50, 328']) 问题是，对于所有文档中的相同属性，表区域并不是恒定的。test_variable =

浏览 23提问于2019-01-14得票数 4

2回答

正如在camelot中提到的，我们可以从特定区域提取表，例如： tables = camelot.read_pdf('table_regions.pdf', table_regions=['170,370,560,270']) 但是我怎样才能为我的pdf找到这些区域。

浏览 34提问于2019-09-20得票数 3

1回答

Camelot没有检测到表中的表

、、

我注意到camelot没有检测到我所拥有的示例文档中的嵌套表。在所附的图像中，我只提取了一个完整的表。我们是否也可以使用它来检测内部表呢？

浏览 4提问于2021-12-23得票数 0

回答已采纳

1回答

table_regions与table_areas的区别

我阅读并重新读取了文档，但我仍然不理解，table_regions和table_areas之间的区别--对于我来说，这两个参数是相同的.我认为文档可以更具体地说明approximate region的含义以及与table_areas的区别我希望有人能向我解释清楚这两种功能的区别。

浏览 5提问于2020-01-20得票数 1

回答已采纳

3回答

Python无边界表提取问题

、

我正在努力提取一些无边界的表格，如下图所示，这些表格来自pdf文件。我已经安装了python，如图中所示，它只适用于边缘表。Python3.6.1(默认，2017年5月15日，11:42:04)GCC 6.3.1 20161221 (红帽6.3.1-1)cv2 - OpenCV 3.4.3

浏览 0提问于2018-11-08得票数 8

回答已采纳

1回答

Camelot PDF维数

、、

不幸的是，我不能对此发表评论，以跟进“任择议定书”，看看他们是否找到了解决办法。我使用Camelot来识别表(很明显)。有时，当我知道页面中可能包含感兴趣表的区域时，我只想在该区域中搜索。问题是，我使用PyMuPDF获取这些坐标，所以它们位于PyMuPDF的坐标系中。我已经知道如何翻译这些坐标，但我遗漏了卡米洛特的一个关键信息--页面的尺寸。我对其他选项开放，基本上我想检查页面的某个

浏览 1提问于2019-12-03得票数 4

1回答

Camelot-py未检测到一行中的两行文本

、、、

使用Camelot-py从.PDF抓取表数据，但它不会拾取堆叠的文本行(请参阅下面的第9行和第10行) camelot.plot(tables[0], kind ='contour')使用MatPlotLib，我可以看到Camelot正确地检测到了第9页<

浏览 14提问于2020-03-12得票数 1

2回答

有没有办法从PDF中提取无边框表格到CSV？

、、

这是我的示例图片，来自pdf文件，有75页。

浏览 77提问于2020-06-08得票数 1

1回答

Python库Camelot没有在一页中读取所有表

、、

我正在使用Camelot库来读取pdf文档页面中的所有表我试着调试绘图页面，如果我改变了页面的风格，我注意到了一些东西：这是带有风味的如果我使用风味=‘stream’，它将正确地读取数据，但只读取一个表：是这样命名的。我尝试使用table_area/table_regions来检测这两个表

浏览 13提问于2022-03-31得票数 0

回答已采纳

2回答

如何遍历数据框列表并在未找到特定字符串时丢弃所有数据

、、、

我正在使用python库Camelot解析多个PDF，并提取出这些PDF文件中的所有表。第一行代码返回从pdf中以列表格式抓取的所有表。我正在寻找一个表，其中有一个独特的字符串。谢天谢地，这个字符串对于这个表是唯一的，所以从理论上讲，我可以使用它来隔离我想要获取的表。这些pdf或多或少是以相同的格式创建的，但是有足够的差异，我不能只在我想要<e

浏览 19提问于2019-03-08得票数 2

回答已采纳

2回答

Python-Camelot提取空表

、、、、

我正在使用Camelot通过以下命令提取PDF的多个部分。38,469,106,456', '39,454,105,445', '38,430,155,420', '38,418,77, 410']) 当PDF实际上包含这些区域中的数据时但我并不期望在每个解析的PDF中都有数据，有些数据返回为空。当返回的数据不是表，并且只有一列时，我会得到以下错

浏览 37提问于2019-01-02得票数 1

1回答

如何使用python-camelot获取表格坐标？

、、

我试图解析一些pdf文件，以便提取一些关键的information.There是在每个pdf中包含这些信息的一部分的表的数量。因此，我尝试使用camelot来提取表，并获得了很好的结果，但我希望提取每个表的标题，因为我希望为每个表与其标题进行映射。因此，我尝试使用tables[i]._bbox获取每个表的坐标，然后向这些坐标添加一些边距，以检测表

浏览 83提问于2019-09-19得票数 3

回答已采纳

1回答

尝试使用camelot-py绘制pdf表，但没有出现表

、、

我正在尝试绘制表格以进行调试并查找表格坐标，但是该图形从未出现在屏幕上。我已经下载了camelot的所有依赖项，但我似乎想不出如何让图形出现。file = "JapanTownDoorSchedule.pdf" print(tables[0].

浏览 31提问于2021-02-27得票数 0

回答已采纳

2回答

camelot python;OSError:异常:访问冲突写入0x00000080

、、、、

我试图用Camelot从PDF文件中提取表格。下面是我的代码：tables = camelot.read_pdf('foo.pdf')当我运行这个脚本时，我得到了如下错误： table=table

浏览 6提问于2019-10-24得票数 1

1回答

如何从PDF文件中的表中提取多个熊猫数据，并将它们存储为Python中的CSV？

、、、

我有一个食谱PDF文件，它由各种表组成，这些表描述了我正在使用的一个数据集中使用的变量。由于实际数据由我需要查找的值组成，因此需要从本食谱中的所有表中创建多个CSV输出文件。例如，在这个PDF文件的第15页，我们有一个表如下所示，我需要从中提取熊猫数据，以便我可以将它保存为CSV文件供以后使用。我不关心这些表中的“总计”，因为我只需要value和label字段。我试图通过在P

浏览 12提问于2021-12-08得票数 0

1回答

如何使用python从pdf中提取单个行表数据？

、、、、

pdf中的一些表只包含一行。我一直在尝试使用camelot库提取数据。使用Camelot提取代码：import camelottables = camelot.read_pdf(file,pages ="all")以上代码无法提取单个行表信息。

浏览 18提问于2022-11-22得票数 -1

回答已采纳

2回答

没有用tabula和camelot检测到的表

、、、、

我试图从PDF中提取我认为格式不正确的表。这些PDF中的表有一种表格格式，但没有适当地用实际边框括起来。输入0表示单个页面，1用于所有页面，2用于表中的页面，3用于特定页面:3输入0表示格，1输入流:0输入页面号: 25没有被camelot找到的表。输入0用

浏览 4提问于2021-11-22得票数 1

3回答

如何从历史PDF中提取表？

、、、、

我需要从这个中从类似格式的表中提取数据。有一些OCR错误，但我有一个自动的方法来纠正它们。对于这类工作<e

浏览 0提问于2019-02-23得票数 1

回答已采纳

1回答

Python Camelot -导出文件，而不附加附加到文件名的字符串。

、、

Python 3.7与Camelot 0.7.3。目前，Camelot将转换后的文件导出为“page--table-”附加到文件名--我们对我们的应用程序有非常具体的文件名要求，而且我正在尝试导出文件，而不需要附加到文件名上的额外字符串。这个是可能的吗？文档中没有提到任何关于如何绕过这个问题的内容。

浏览 2提问于2020-03-12得票数 1

2回答

用Camelot解析Python并提取表标题

、、、

Camelot是一个非常棒的Python库，可以作为数据框架从pdf文件中提取表。然而，我正在寻找一个解决方案，它也返回表的描述文本，写在表的上方。我用于从pdf中提取表的代码如下：tables = camelot.read_pdf('test.pdf', pages='all',lattice=True, suppress_s

浏览 0提问于2019-10-01得票数 5

回答已采纳

点击加载更多