工作中经常有些数据,从多个EXCEL表中汇总后,会出现同一项目多条记录的情况,需要合并这些对应的记录。
数据示例:
下图中,我们state和year能确定一个项目,但是有2条记录,我们需要把对应记录的pop值相加。
代码
#!/usr/bin/python3 # -*- coding: utf-8 -*- # CreateDate: 2018-12-06 import pandas as pd frame = pd.read_csv("test.csv") df = frame.groupby(['state', 'year']).sum() df.to_csv("out.csv")
输出的out.csv如下:
领取专属 10元无门槛券
私享最新 技术干货