文章/答案/技术大牛

发布

社区首页 >问答首页 >确保没有重复的行被写入CSV

问确保没有重复的行被写入CSV
EN

Stack Overflow用户

提问于 2014-07-17 17:50:13

回答 3查看 1.2K关注 0票数 0

目前，我正在用以下代码将数据集中的行写入CSV文件：

with open('Private-Jet-Data.csv', 'a') as f:
    writer = csv.writer(f,delimiter=",")
    for row in data:
        writer.writerow(row)

是否有更有效的方法确保在不首先打开文件并对data列表中的每一行遍历整个文件的情况下，文件中没有任何行是复制的？

python

csv

回答 3

Stack Overflow用户

回答已采纳

发布于 2014-07-17 17:52:12

不，不可能。

您将需要将数据保存在内存中的某个位置进行比较，这意味着您必须从文件中读取以前的数据，并且只追加该文件中缺少的数据集。

还请注意，在当前的代码片段中，与.csv文件中的条目相比，没有任何地方可以比较。

票数 1

Stack Overflow用户

发布于 2014-07-17 17:58:39

您只需将“看见”值添加到动态设置中：

with open('Private-Jet-Data.csv', 'a') as f:
    writer = csv.writer(f,delimiter=",")
    seen = set()
    for row in data:
        if row in seen:
            continue 
        writer.writerow(row)
        seen.add(row)

它比两次读取源文件更有效，但是如果您正在处理一个大文件，它仍然会占用一些内存。

票数 0

Stack Overflow用户

发布于 2022-04-08 11:16:21

 f.writelines(sorted(set(ls)))

设置！

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/24810265

复制

相似问题

问确保没有重复的行被写入CSV
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问确保没有重复的行被写入CSVEN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问确保没有重复的行被写入CSV
EN