在Pandas中,可以使用groupby
函数按照某个列的值对数据进行分组。然后,通过transform
函数结合mean
函数计算每个分组的均值,并将均值应用到每个分组的每条记录上。下面是具体的步骤:
import pandas as pd
Category
和Value
。data = {'Category': ['A', 'A', 'B', 'B', 'C'],
'Value': [1, 2, 3, 4, 5]}
df = pd.DataFrame(data)
groupby
函数按照Category
列进行分组,然后使用transform
函数结合mean
函数计算每个分组的均值,并将均值应用到每个分组的每条记录上。这里将计算结果保存在新的一列Mean
中。df['Mean'] = df.groupby('Category')['Value'].transform('mean')
最终,DataFrame将会变成如下形式:
Category Value Mean
0 A 1 1.5
1 A 2 1.5
2 B 3 3.5
3 B 4 3.5
4 C 5 5.0
这样,每个分组(A、B、C)中的每条记录都被添加了对应的均值。
推荐的腾讯云相关产品和产品介绍链接地址如下:
领取专属 10元无门槛券
手把手带您无忧上云