我有一个数据帧与图纸的数量,我想删除重复从所有图纸。我使用下面的代码
df = df.drop_duplicates(subset='Month',keep='last')
在那之后我保存这个df
df.to_excel(path,index=False)
但它只删除了第一页重复的内容,并且只显示一页
发布于 2019-09-23 14:32:31
我建议将文档的每个工作表视为一个单独的数据框,然后在迭代中根据您的标准删除每个集合的重复项。这是我脑海中的概念的快速草稿,有两张纸:
xls = pd.ExcelFile('myFile.xls')
xls_dfs = []
df1 = pd.read_excel(xls, 'Sheet1')
xls_dfs.append(df1)
df2 = pd.read_excel(xls, 'Sheet2')
xls_dfs.append(df2)
for df in xls_dfs:
df = df.drop_duplicates(subset='Month',keep='last')
df.to_excel('myFile.xls',index=False)
https://stackoverflow.com/questions/58056642
复制相似问题