Python大型Excel文件读取cols时出错，文件的行大小为90mb

。

在处理大型Excel文件时，可能会遇到一些性能和内存方面的问题。为了解决这个问题，可以使用pandas库来读取和处理Excel文件。

首先，确保已经安装了pandas库。可以使用以下命令进行安装：

pip install pandas

接下来，使用pandas的read_excel函数来读取Excel文件。可以指定需要读取的列数，以减少内存占用。示例代码如下：

import pandas as pd

# 读取Excel文件的前n列
n = 10  # 假设需要读取前10列
df = pd.read_excel('文件路径.xlsx', usecols=range(n))

# 处理读取的数据
# ...

# 打印前几行数据
print(df.head())

在上述代码中，将文件路径替换为实际的文件路径，并根据需求设置需要读取的列数n。通过设置usecols参数为range(n)，可以只读取前n列的数据，从而减少内存占用。

此外，还可以使用pandas的chunksize参数来分块读取大型Excel文件，以进一步降低内存的使用。示例代码如下：

import pandas as pd

# 读取Excel文件的前n列
n = 10  # 假设需要读取前10列
chunksize = 1000  # 每次读取1000行数据
reader = pd.read_excel('文件路径.xlsx', usecols=range(n), chunksize=chunksize)

# 处理读取的数据
for chunk in reader:
    # 处理每个数据块
    # ...

# 打印前几行数据
print(chunk.head())

在上述代码中，通过设置chunksize参数为1000，每次读取1000行数据，然后逐块处理数据。这样可以有效地减少内存的使用。

对于大型Excel文件的处理，还可以考虑使用其他的库，如openpyxl、xlrd等。这些库提供了更底层的操作接口，可以更加灵活地处理大型Excel文件。

总结起来，处理大型Excel文件时，可以采取以下步骤：

安装pandas库：pip install pandas
使用pandas的read_excel函数读取Excel文件，并指定需要读取的列数，以减少内存占用。
可以考虑使用chunksize参数来分块读取大型Excel文件，以进一步降低内存的使用。
如果需要更底层的操作接口，可以考虑使用其他的库，如openpyxl、xlrd等。

腾讯云提供了云计算相关的产品和服务，如云服务器、云数据库、云存储等。具体可以参考腾讯云的官方文档和产品介绍页面，链接如下：

腾讯云官方文档：https://cloud.tencent.com/document/product
腾讯云云服务器：https://cloud.tencent.com/product/cvm
腾讯云云数据库：https://cloud.tencent.com/product/cdb
腾讯云云存储：https://cloud.tencent.com/product/cos

请注意，以上答案仅供参考，具体的解决方案可能需要根据实际情况进行调整和优化。

Python大型Excel文件读取cols时出错，文件的行大小为90mb

import xlrd print(excel_file) worksheet = wb.sheet_by_index(0) column_count =worksheet.ncols

浏览 44提问于2020-05-05得票数 1

1回答

不能再用Stata打开.xlsx文件了

、

自从更新到Excel 2013之后，我突然不能再将.xlsx文件导入Stata了。.xls或.csv仍然工作正常。还有其他人遇到过这个问题吗？

浏览 2提问于2016-02-25得票数 0

1回答

下面的代码读取csv文件(进入dataset DataFrame)，并将其转换为一个列表(转换为transactions列表)，由apriori算法处理。import pandas as pd transactions = []num_colsfor i in range(0, num_rows): transactions.append([str(dataset.values[i,j]) for

浏览 0提问于2018-05-17得票数 1

回答已采纳

2回答

无法在Python中读取完整的文本文件

、

我在读取Python中的文件时遇到问题。我在Python中读取的文件大小是90Mb。当在word中打开时，它显示总字数约为1400万。但是当我用Python读取该文件时，它给出的文件长度约为900万个单词(8915710个单词)。当我通过python命令查

浏览 0提问于2013-03-08得票数 0

回答已采纳

2回答

使用openpyxl流技能和加载工作簿

、

我正在尝试遵循我从Streamskill购买的一个教程，这个教程实际上非常好，直到我遇到这个问题，花了好几个小时试图找出我哪里错了。谢谢，希望能尽快收到您的回音。\Python39\lib\site-packages\op

浏览 3提问于2021-02-21得票数 2

1回答

出现错误时，从列表中删除文件名

、、

xls", ignore.case=TRUE)) for (f in filenames) { { },cat("File doesn't appear to open:", f,

浏览 11提问于2020-08-26得票数 0

回答已采纳

1回答

从Server导入的CSV文件在格式化日期时间后丢失了数据

、、、

我有一个从Server导出的大型CSV文件(1.1G)，我想要在python中进行预处理，但是我在这样做时遇到了一些问题。原来的CSV文件datetime值看起来像这个00:07.5, 00:08.3, 00:48.7，所以我必须通过格式化整个列来将它们手动转换为1/12/2015 12:00:07 am, 1/12/2015但是我注意到文件大小已经从36.6 MB从1.1G缩小到了1.1G。我

浏览 4提问于2019-10-28得票数 0

回答已采纳

2回答

numpy无法调整大矩阵的大小

、、、

我使用openpyxl和numpy来读取大型excel文件。a.append(k.value) aa= np.resize(a, [m, n]) 对于中等大小的文件(4MB excel文件，16000行，50列)，它们工作得很好。但是，对于大文件(21B，100000行，50列)，numpy

浏览 0提问于2017-05-10得票数 0

2回答

图书没有调用extract_formulas ()的xlrd.open_workbook属性

我有这样的代码：excel_workbook回溯(最近一次调用)：文件“C:/User/m.macapana/IdeaProjects/OFCCP工具/用Python/Pandas.py读取Excel文件”，第4行</em

浏览 5提问于2021-08-04得票数 0

5回答

为什么PHPExcel不允许写入超过5000行

、

谁能告诉我为什么PHPExcel不允许超过5000行。我正在使用一个开源的PHPExcel来生成我的项目的报告，并且我无法从Mysql-DB中写入超过5000行的数据。我的结果集提取7230记录查询执行的时间。我该怎么解决它..。

浏览 3提问于2011-02-04得票数 8

回答已采纳

1回答

在R中读取带有两行标头的excel

、、、

我有一个excel文件与简单的结构，如下图所示。0.42 0.42 0.42 0.42 0.42 0.42B 0.42 0.42 0.42一个重要的补充样本结构-只是整个表的一

浏览 3提问于2017-04-06得票数 1

回答已采纳

2回答

读取大型Excel* xlsx文件的最快方法？并行化还是不并行？*

、、

我的问题是：如果像我一样从旋转磁盘读取，当多个进

浏览 0提问于2019-04-04得票数 11

回答已采纳

2回答

Python:解析大型json文件

、

我有一个很大的json文件。它的日志数据，我已将其压缩为bz2格式(myfile.json.bz2)。bz2文件的大小为90MB。我寻找了一个很好的解决方案或一篇博客文章，解释了如何有效地解析压缩的bz2 json文件，但没有找到任何东西。因为文件很大，所以不可能做像这样的事情。with open('data.json')

浏览 1提问于2015-01-22得票数 3

1回答

日语字符在ReadOnlySharedStringsTable中没有正确显示

、、、

我在Excel文件中读取日文字符有问题。读者的构造函数是： this.opcPkg = OPCPackage.open文件中，它只读取为予算。有些是在Excel文件中显示的，而有些则不是。我不知道哪里出了问题，编码是UTF-8。我正在读取一个大型</

浏览 9提问于2015-11-05得票数 0

回答已采纳

2回答

无法使用熊猫读取excel文件的所有页。

、、、、

此程序用于读取excel文件的第一页，而我试图读取excel文件的所有工作表，但无法读取所有的工作表。python 当我在阅读excel行中添加sheet_name = None时，遇到这样的错误，我无法找出错误是什么，以及如何纠正错误。HFZx_P-py3.9) PS F:\mohan> & C:/Us

浏览 1提问于2022-01-11得票数 1

回答已采纳

1回答

用Python读取excel并隔离列/行来绘制

、、、

我正在使用Python熊猫read_excel创建一个直方图或线条图。我想把整份文件都读一遍。这是一个很大的文件，我只想在上面画出某些值。我知道如何在parse_cols中使用read_excel和read_excel，但是如果我这样做了，它就不会读取我需要用于轴标签的文件的一部分。我也不知道如何告诉它画出我想要的x值和y值的图。以下是我所拥有的

浏览 2提问于2017-10-17得票数 1

回答已采纳

1回答

C#读取excel文件>100MB

、、、、

所以我尝试用C#读取一个excel文件，文档大小为181MB。我无法让OpenXML正常工作，而且ClosedXML似乎在处理大型excel文件时遇到了问题(读取该文件至少也需要6分钟)。我最喜欢ExcelDataReader，因为我可以像读取数组一样读取数据表，但它确实需要4-5分钟来读取文件，这比Interlop快得多，但这

浏览 6提问于2018-08-10得票数 0

3回答

CodeIgniter:允许内存耗尽

、

我要做的是读取Excel文件并保存到数据库中。要读取Excel文件，我使用。上传后，在读取Excel文件时，我将得到以下错误：致命错误:在第430行的/home/webscwi1/public_html/projects/OnlineExam/application/libraries&#x

浏览 4提问于2013-02-05得票数 4

2回答

读取大型XLS和XLSX格式

、

我试图读取大型excel文件，其大小约为40 am至50 am。你能帮我解决这个问题吗？基本上，我们正在将excel文件转换为标签分隔的文

浏览 2提问于2016-06-07得票数 0

1回答

警告: simplexml_load_string()：内存分配失败:缓冲区不断增长

、、

以下代码用于使用PHPExcel将XLSX文件转换为CSV： require_once 'PHPExcel/PHPExcel/IOFactory.php'; $writer = PHPExcel_IOFactory::createWriter($excel, 'CSV'); $writer->setDe

浏览 0提问于2013-11-22得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Python大型Excel文件读取cols时出错，文件的行大小为90mb

相关·内容

Python大型Excel文件读取cols时出错，文件的行大小为90mb

不能再用Stata打开.xlsx文件了

在大型数据集中有效地将数据转换为列表

无法在Python中读取完整的文本文件

使用openpyxl流技能和加载工作簿

出现错误时，从列表中删除文件名

从Server导入的CSV文件在格式化日期时间后丢失了数据

numpy无法调整大矩阵的大小

图书没有调用extract_formulas ()的xlrd.open_workbook属性

为什么PHPExcel不允许写入超过5000行

在R中读取带有两行标头的excel

读取大型Excel* xlsx文件的最快方法？并行化还是不并行？*

Python:解析大型json文件

日语字符在ReadOnlySharedStringsTable中没有正确显示

无法使用熊猫读取excel文件的所有页。

用Python读取excel并隔离列/行来绘制

C#读取excel文件>100MB

CodeIgniter:允许内存耗尽

读取大型XLS和XLSX格式

警告: simplexml_load_string()：内存分配失败:缓冲区不断增长

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐