我正在尝试用pandas的read_excel方法把一个excel表格读成df文件。excel文件包含6-7个不同的工作表。其中,2-3张纸非常大。我只想从文件中读出一张excel表格。如果我把这张纸复制出来并阅读,时间就减少了90%。
我读过pandas使用的xlrd总是将整个工作表加载到内存中。我不能更改输入的格式。
你能建议一种提高性能的方法吗?
发布于 2018-01-18 04:20:27
这很简单。就这么做吧。
import pandas as pd
xls = pd.ExcelFile('C:/users/path_to_your_excel_file/Analysis.xlsx')
df1 = pd.read_excel(xls, 'Sheet1')
print(df1)
# etc.
df2 = pd.read_excel(xls, 'Sheet2')
print(df2)
发布于 2017-12-22 20:55:17
在只读模式下使用openpyxl。请参阅http://openpyxl.readthedocs.io/en/default/pandas.html
发布于 2019-08-20 23:05:36
import pandas as pd
df = pd.read_excel('YourFile.xlsx', sheet_name = 'YourSheet_Name')
无论你想读什么工作表,只需将工作表名称和路径放到excel文件中即可。
https://stackoverflow.com/questions/47922946
复制相似问题