现在,我每次运行脚本时都会导入一个相当大的CSV
作为数据帧。有没有一个好的解决方案可以让数据帧在两次运行之间持续可用,这样我就不必花费所有的时间来等待脚本运行?
发布于 2015-10-10 12:52:42
泡菜效果很好!
import pandas as pd
df.to_pickle('123.pkl') #to save the dataframe, df to 123.pkl
df1 = pd.read_pickle('123.pkl') #to load 123.pkl back to the dataframe df
发布于 2017-10-17 14:28:52
您可以使用羽化格式的文件。它的速度非常快。
df.to_feather('filename.ft')
发布于 2015-11-13 05:46:30
Pandas DataFrames具有to_pickle
函数,该函数对于保存DataFrame非常有用:
import pandas as pd
a = pd.DataFrame({'A':[0,1,0,1,0],'B':[True, True, False, False, False]})
print a
# A B
# 0 0 True
# 1 1 True
# 2 0 False
# 3 1 False
# 4 0 False
a.to_pickle('my_file.pkl')
b = pd.read_pickle('my_file.pkl')
print b
# A B
# 0 0 True
# 1 1 True
# 2 0 False
# 3 1 False
# 4 0 False
https://stackoverflow.com/questions/17098654
复制相似问题