我有一个大的csv文件,它包含重复的行,我想删除所有这些重复的行,包含单词"Names“。
1 Names Dates Picture
2 Alex 6-12 4364.jpg
3 Names Dates Picture
4 Jade 8-11 7435.jpg
5 Names Dates Picture
6 Dread 1-5 8635.jpg
csv文件如下所示。我想删除这些重复的“名称”“日期”“图片”的所有行。
我尝试过与网上不同的方法,但我找不到解决办法
我使用熊猫导入csv文件df = pd.read_csv('file2022.csv')
发布于 2022-04-17 12:59:08
您可以在这里使用drop_duplicates
:
df = pd.read_csv('test2.csv', sep=' *', engine='python', header=None, index_col=0)
df.drop_duplicates(keep=False, inplace=True)
df.reset_index(inplace=True, drop=True)
print(df)
输出:
1 2 3
0 Alex 6-12 4364.jpg
1 Jade 8-11 7435.jpg
2 Dread 1-5 8635.jpg
发布于 2022-04-17 12:52:59
df = df[df["Names"] != "Names"]
应该删除"Names“列下的"Names”值。
https://stackoverflow.com/questions/71901835
复制相似问题