python数据分析工具pandas:合并excel重复行

工作中经常有些数据,从多个EXCEL表中汇总后,会出现同一项目多条记录的情况,需要合并这些对应的记录。

数据示例:

下图中,我们state和year能确定一个项目,但是有2条记录,我们需要把对应记录的pop值相加。

代码

#!/usr/bin/python3 # -*- coding: utf-8 -*- # CreateDate: 2018-12-06 import pandas as pd frame = pd.read_csv("test.csv") df = frame.groupby(['state', 'year']).sum() df.to_csv("out.csv")

输出的out.csv如下:

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181206A1JG0A00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券