问Python 3.7:大数据文件比较的性能调优
EN

Stack Overflow用户

提问于 2018-06-04 18:40:50

回答 2查看 175关注 0票数 1

我有两个csv文件，每个都有3 GB的大小，用来比较和存储第三个文件中的差异。

Python代码：

with open('JUN-01.csv', 'r') as f1:
    file1 = f1.readlines()

with open('JUN-02.csv', 'r') as f2:
    file2 = f2.readlines()

with open('JUN_Updates.csv', 'w') as outFile:
    outFile.write(file1[0])
    for line in file2:
        if line not in file1:
            outFile.write(line)

执行时间：45分钟且仍在运行...

python

python-3.x

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/50678710

复制

相似问题

问Python 3.7:大数据文件比较的性能调优
EN

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python 3.7:大数据文件比较的性能调优EN

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python 3.7:大数据文件比较的性能调优
EN