首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python自动化之Excel去除相同数据

之前分享了一篇关于Python的Excel合并的文章。链接在下方,今天为大家分享一个Python去除Excel中相同数据也是以一个工资表为例。为方便观赏,数据量少,足够使用。

致力打造口中:别人的公众号(文末有视频执行效果哦!!)

素材准备

一个带有重复数据的Excel工资表

可以看到,数据中王一是有两行

安装下载模块(numpy、pandas、xlrd)

选择正确的路径(工资表路径)

写代码

如何筛选数据

此次通过手机号来筛选数据

名字可能相同,工资等也有可能相同

但是手机号是唯一

代码分享

#去除重复数据

import pandas as pd # pip3 install pandas

import numpy as np # pip3 install numpy

import xlrd # pip install xlrd

labelName_phone = '手机号'

file_name = "2月份工资表"

frame = pd.read_excel('assets/'+file_name+'.xlsx')

data = pd.DataFrame(frame)

data.drop_duplicates([labelName_phone], keep='last', inplace=True)

data.to_excel('assets/'+file_name+'去重数据.xlsx')

print('完成')

效果展示

代码成功运行以后,可以看到文件夹内多了一个Excel表。

打开即可发现,里面相同数据仅剩下一个。

如图所示

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20210226A0F07P00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券