pandas是一个强大的数据分析工具,而groupby()是pandas中用于分组操作的函数。通过groupby()函数,我们可以将数据按照指定的列进行分组,并对每个分组进行相应的计算。
在使用groupby()函数时,我们可以通过添加公式的计算列来对每个分组进行计算。这可以通过使用pandas的apply()函数结合lambda表达式来实现。下面是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'John'],
'Subject': ['Math', 'English', 'Math', 'English', 'Math'],
'Score': [80, 75, 90, 85, 95]}
df = pd.DataFrame(data)
# 使用groupby()函数按照Name列进行分组,并添加计算列AverageScore
df['AverageScore'] = df.groupby('Name')['Score'].apply(lambda x: x.mean())
print(df)
运行以上代码,输出结果如下:
Name Subject Score AverageScore
0 Tom Math 80 82.5
1 Nick English 75 75.0
2 John Math 90 90.0
3 Tom English 85 82.5
4 John Math 95 90.0
在上述代码中,我们首先创建了一个示例数据集df。然后,使用groupby()函数按照Name列进行分组,并通过lambda表达式计算每个分组的平均分数。最后,将计算结果赋值给新的列AverageScore。
这样,我们就成功地使用pandas的groupby()函数添加了公式的计算列。
推荐的腾讯云相关产品:腾讯云数据分析平台(https://cloud.tencent.com/product/dap)
领取专属 10元无门槛券
手把手带您无忧上云