首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >Python 3.7:大数据文件比较的性能调优

Python 3.7:大数据文件比较的性能调优
EN

Stack Overflow用户
提问于 2018-06-04 18:40:50
回答 2查看 175关注 0票数 1

我有两个csv文件,每个都有3 GB的大小,用来比较和存储第三个文件中的差异。

Python代码:

代码语言:javascript
复制
with open('JUN-01.csv', 'r') as f1:
    file1 = f1.readlines()

with open('JUN-02.csv', 'r') as f2:
    file2 = f2.readlines()

with open('JUN_Updates.csv', 'w') as outFile:
    outFile.write(file1[0])
    for line in file2:
        if line not in file1:
            outFile.write(line)

执行时间:45分钟且仍在运行...

EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50678710

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档