聚合数据帧并按r中的重复行对列的值求和可以使用Pandas库来实现。
首先,我们需要导入Pandas库:
import pandas as pd
然后,我们可以创建一个数据帧(DataFrame)对象,假设为df,包含需要聚合的数据:
df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'two', 'two', 'one', 'one', 'two'],
'C': [1, 2, 3, 4, 5, 6, 7, 8],
'D': [10, 20, 30, 40, 50, 60, 70, 80]})
接下来,我们可以使用groupby()
函数将数据按照列A和B进行分组,并使用sum()
函数对分组后的数据进行求和:
result = df.groupby(['A', 'B']).sum()
最后,我们可以打印出结果:
print(result)
完整的代码如下:
import pandas as pd
df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'two', 'two', 'one', 'one', 'two'],
'C': [1, 2, 3, 4, 5, 6, 7, 8],
'D': [10, 20, 30, 40, 50, 60, 70, 80]})
result = df.groupby(['A', 'B']).sum()
print(result)
这样就可以实现按照r中的重复行对列的值求和的聚合操作了。
关于Pandas库的更多信息和使用方法,可以参考腾讯云的产品介绍链接地址:Pandas产品介绍
领取专属 10元无门槛券
手把手带您无忧上云