我正在使用Stata处理一些数据,将数据导出到csv文件中,并使用read_csv函数将其加载到Python中。
问题是每件事都太慢了。从Stata导出到csv文件需要很长的时间( data格式的导出要快得多),通过read_csv加载数据也非常缓慢。使用read_stata熊猫功能更糟糕。
我想知道还有其他选择吗?比如导出csv以外的格式?我的csv数据集大约有6-7 Gb大.
感谢你的任何帮助
谢谢
发布于 2015-04-30 17:22:00
相当有效的pd.read_stata()/.to_stata()
,参见这里
https://stackoverflow.com/questions/29972946
复制相似问题