仅将一个工作表加载到dataframe

、、、、

我正在尝试用pandas的read_excel方法把一个excel表格读成df文件。excel文件包含6-7个不同的工作表。其中，2-3张纸非常大。我只想从文件中读出一张excel表格。我读过pandas使用的xlrd总是将整个工作表加载到内存中。我不能更改输入的格式。你能建议一种提高性能的方法吗？

浏览 31提问于2017-12-21得票数 2

2回答

从HDF5文件读取pandas.Dataframe列的子集

、、、、

我在HDF5文件中保存了一个pandas.DataFrame。DataFrame由多个列组成，大小非常大。HDF5文件中每个表的大小都大于2 2GB。对于分析，希望仅将表的列的子集加载到存储器中。使用SQLite3，这是一项微不足道的工作。只需使用"select column1，colum2，... from table1“查询即可。在Python中有没有一种简单的方法可以做到这一点？请注意，pandas.read_hdf不

浏览 2提问于2019-08-07得票数 0

1回答

如何创建多层(而不是多层)支点

、

在Excel中，是否可以创建一个支点，在本质上同时显示多个视图。在下面的例子中，我们有三个公司销售的视图，按地点，按类别和按零售/贸易。

浏览 4提问于2017-03-17得票数 0

2回答

如何在Pandas数据帧中查看工作表n？

我使用以下命令将Excel文件加载到pandas数据帧中： df = pandas.read_excel("file.xlsx") 该文件有多个工作表，但当我调用dataframe名称时，只显示第一个工作表如何查看其他工作表？

浏览 17提问于2021-11-22得票数 0

2回答

使用Write_Truncate将数据加载到“分区表”

可以用write_truncate将数据加载到特定的分区吗？我的用例是一个批处理加载过程，它覆盖特定的分区，同时保持表的其余部分保持不变。此引用只提到命令行工具：

浏览 3提问于2016-06-06得票数 3

回答已采纳

1回答

如何在Excel中创建从查询编辑器刷新的文件并对其进行操作

、、

我正在使用Power Query Editor创建一个工作文件，使用来自多个源的多个表。有没有办法<

浏览 0提问于2018-07-27得票数 0

1回答

列出数据库中的所有笔记本和作业，并将结果集加载到数据帧和托管表中

、、、

有没有一种方法可以列出databricks中一个工作区中的所有笔记本和作业，并将它们加载到DBFS中的托管表中？我在下面的链接中找到了一个函数代码 https://kb.databricks.com/python/list-all-workspace-objects.html 但是，这不会给出作业列表。还主要需要将结果集存储到dataframe中，以便我们可以将dataframe存储在表中。

浏览 17提问于2021-11-09得票数 1

1回答

懒惰创建来自PostgreSQL / Cassandra的Dask DataFrame

、、、、

据我所知，Dask DataFrame是处理表格数据的正确方法。我在PostgreSQL中有一个表，我知道如何将它加载到pandas.Dataframe中。我知道，odo可以用来将pandas.DataFrame转换成dask.dataframe。但这不是惰性操作:这种转换强制将整个PostgeSQL表加载到内存中，这是不好的。

浏览 1提问于2016-10-06得票数 6

1回答

Pandas错误地读取len为1的嵌套ordereddict

、、

我想把一个有序的字典加载到pandas数据框中： [ ('field1',('field3', '*****'), ('field5', '*****'))pd

浏览 0提问于2021-10-26得票数 0

1回答

如何仅将表中某列的特定值加载到组合框中

、、、、

如何才能仅将表中列的特定值加载到组合框中(例如，假设在保修表中有一个名为" exp_date“的列，我希望将warrandy_id加载到组合框中，其中exp_date等于今天的日期)。

浏览 3提问于2013-09-11得票数 0

1回答

将配置单元分区表加载到Spark Dataframe

、、、、

我正在尝试将一个已分区的配置单元表加载到一个DataFrame中，其中在配置单元表中按year_week编号进行分区，在这种情况下，我可能有104个分区。但是我可以看到DataFrame正在将数据加载到200个分区中，我知道这是因为spark.sql.shuffle.partitions默认设置为200。我想知道是否有什么好方法可以将我的Hive表加载到具有104个分区的Spark

浏览 1提问于2016-03-28得票数 1

1回答

在databricks中，如何将表数据加载到数据帧中？逐行还是批量？

、、

我需要将一个包含大约1400万条记录的表中的几列加载到dataframe中。一旦表被加载，我需要根据两列中出现的值创建一个新列。我希望在将表加载到dataframe中时，为新列编写逻辑以及select命令。首先将这几列的表加载到df中，然后在已加载的df上执行列操作，是不是更好？表数据是一次性加载所有数据还是逐行加载到df中？如果逐行执行，那么

浏览 12提问于2020-12-20得票数 0

1回答

我如何将数据从dataframe(在python中)插入到greenplum表？

、

请建议一种直接从python数据框架到greenplum表的批量插入格林梅利表的方法。解决方案：(我能想到的)当gpload请求文件路径时。我能给你递一份不同的或数据吗？有什么方法可以将数据装载到格林梅中吗?我不想

浏览 0提问于2017-11-22得票数 3

回答已采纳

1回答

从bigquery表中读取数据帧，然后删除该表

、、

我尝试从bigquery中读取一个表，然后将其转换为dataframe，最后删除该表。但是由于数据帧是延迟计算的，所以会发生什么呢?它首先删除表，然后尝试读取它。在将表加载到dataframe之后，有什么方法可以删除它吗？

浏览 3提问于2017-01-18得票数 0

1回答

数据列之和

、、、、

我有一个dataframe，它有不同数量的列，取决于我的数据集。我想要一个函数，将这些列的组合加起来，并将这些新的“加总列”附加到现有的dataframe中。例如，如果我有3列，我希望多3列，1列加2，1列加3，3列加2。非常感激。

浏览 3提问于2022-06-20得票数 0

1回答

如何使用openpyxl枚举具有(非空)值的Excel工作表中的所有单元格？

、、、

我的问题是，一些excel工作表有非常多的空行，例如下面的3. Access Control工作表有1048534行和16384列，尽管只有前100行是非空的。openpyxl是否支持过滤所有这些多余的行，并且只返回包含至少一个非空单元格的一组行？ >>> for ws in wb.worksheets: ...

浏览 72提问于2020-10-30得票数 0

1回答

如何处理Excel中的大量数据(例如powerquery)

、

我得到了一个包含10个csv文件的文件夹，这些文件始终处于xlsx行限制1.048.576行的范围内。表1:文件1-3页2:文件4-8页3:文件9-10. 是否有一种方法可以为每个文件获取不同的查询，然后将这些查询附加到工作表</em

浏览 1提问于2022-05-13得票数 1

1回答

Spark中多个数据帧上的大量转换

、

我有一个基于spark的转换引擎，它是元数据驱动的。我在Scala MapString DataFrame中对内存中存储的多个数据帧执行一组转换。如果我在前84次转换后写入中间转换结果，然后将数据帧从输出路径加载到Map中。下一组转换可以正常工作。如果我不这样做，仅评估就需要30分钟。我的方法:我尝试使用以下方法持久化Dataframe： dfMap(target).cache() 但这种方法并没有帮助。

浏览 11提问于2020-06-27得票数 0

1回答

导入Excel工作簿的多个工作表

、

现在，我只需要将一个工作簿的几个工作表加载到R中，并对这几个工作表应用一个函数。我学习了如何加载该函数并将其应用于所有工作表。readWorksheet(wb, sheet = getSheets(wb))如何修改此代码，以便仅将函数应用于几个工作<e

浏览 7提问于2018-01-22得票数 0

1回答

Excel -透视表-来自多个工作表的数据

、

我正在尝试从多个工作表到一个数据透视表创建一个Excel数据透视表。我遇到的问题是，我从数据中提取的数据是按周分离的，并且它没有格式化为表格。我包含了一个源数据来源的截图。有没有什么方法可以让一个数据透视表工作呢？我想要做的是从LOB列中拉出，并在那里列出了一个计数。任何帮助都是非常感谢的。

浏览 27提问于2021-03-02得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

从HDF5文件读取pandas.Dataframe列的子集

如何创建多层(而不是多层)支点

如何在Pandas数据帧中查看工作表n？

使用Write_Truncate将数据加载到“分区表”

如何在Excel中创建从查询编辑器刷新的文件并对其进行操作

列出数据库中的所有笔记本和作业，并将结果集加载到数据帧和托管表中

懒惰创建来自PostgreSQL / Cassandra的Dask DataFrame

Pandas错误地读取len为1的嵌套ordereddict

如何仅将表中某列的特定值加载到组合框中

将配置单元分区表加载到Spark Dataframe

在databricks中，如何将表数据加载到数据帧中？逐行还是批量？

我如何将数据从dataframe(在python中)插入到greenplum表？

从bigquery表中读取数据帧，然后删除该表

数据列之和

如何使用openpyxl枚举具有(非空)值的Excel工作表中的所有单元格？

如何处理Excel中的大量数据(例如powerquery)

Spark中多个数据帧上的大量转换

导入Excel工作簿的多个工作表

Excel -透视表-来自多个工作表的数据

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐