问如何在python中从dataframe中的所有表中删除重复项
EN

Stack Overflow用户

提问于 2019-09-23 14:20:49

回答 1查看 45关注 0票数 0

我有一个数据帧与图纸的数量，我想删除重复从所有图纸。我使用下面的代码

df = df.drop_duplicates(subset='Month',keep='last')

在那之后我保存这个df

df.to_excel(path,index=False)

但它只删除了第一页重复的内容，并且只显示一页

python-3.x

回答 1

Stack Overflow用户

发布于 2019-09-23 14:32:31

我建议将文档的每个工作表视为一个单独的数据框，然后在迭代中根据您的标准删除每个集合的重复项。这是我脑海中的概念的快速草稿，有两张纸：

xls = pd.ExcelFile('myFile.xls')
xls_dfs = []
df1 = pd.read_excel(xls, 'Sheet1')
xls_dfs.append(df1)
df2 = pd.read_excel(xls, 'Sheet2')
xls_dfs.append(df2)
for df in xls_dfs:
    df = df.drop_duplicates(subset='Month',keep='last')
    df.to_excel('myFile.xls',index=False)

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/58056642

复制

相似问题

问如何在python中从dataframe中的所有表中删除重复项
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在python中从dataframe中的所有表中删除重复项EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在python中从dataframe中的所有表中删除重复项
EN