本文是自己工作中用到的代码,
用的到知识点有
DataFrame.read_excel,to_excel
iloc
dropna
merge
吐槽一下社保导出的文件,:
1.社保现在分开个系统购买,导出来的文件有两个...又要在两个文件中查找,
所以整理社保的数据是Excel使用者的一个挑战。...','个人缴费合计','单位缴费合计','养老合计','养老本月单位收','养老本月个人收','养老本月单位补','养老本月个人补','职业合计','职业本月单位收','职业本月个人收','职业本月单位补...())
代码解析:
先用df读取“四险”的数据,
再用第四列中含有“"2049867-佛山市XXXXX"”的全部取出,如果没有的就删除,这一步可以删除重复的合并单元形式的每隔几行就有的烦人的标题,
用再...xlsx”数据
mydata=mydata[mydata[4]=="2049867-XXXXXXX"]到第四列中有“***”的数据行的数据,这可以删除烦人的标题
mydata=mydata.dropna