首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何在python中从dataframe中的所有表中删除重复项

如何在python中从dataframe中的所有表中删除重复项
EN

Stack Overflow用户
提问于 2019-09-23 14:20:49
回答 1查看 45关注 0票数 0

我有一个数据帧与图纸的数量,我想删除重复从所有图纸。我使用下面的代码

代码语言:javascript
运行
复制
df = df.drop_duplicates(subset='Month',keep='last')

在那之后我保存这个df

代码语言:javascript
运行
复制
df.to_excel(path,index=False)

但它只删除了第一页重复的内容,并且只显示一页

EN

回答 1

Stack Overflow用户

发布于 2019-09-23 14:32:31

我建议将文档的每个工作表视为一个单独的数据框,然后在迭代中根据您的标准删除每个集合的重复项。这是我脑海中的概念的快速草稿,有两张纸:

代码语言:javascript
运行
复制
xls = pd.ExcelFile('myFile.xls')
xls_dfs = []
df1 = pd.read_excel(xls, 'Sheet1')
xls_dfs.append(df1)
df2 = pd.read_excel(xls, 'Sheet2')
xls_dfs.append(df2)
for df in xls_dfs:
    df = df.drop_duplicates(subset='Month',keep='last')
    df.to_excel('myFile.xls',index=False)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58056642

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档