Pandas使用groupby创建新列并避免循环

Pandas是一个基于Python的数据分析库，提供了丰富的数据结构和数据处理功能。在Pandas中，可以使用groupby方法对数据进行分组，并通过创建新列来实现对分组数据的操作，同时避免使用循环。

具体步骤如下：

导入Pandas库：

import pandas as pd

创建DataFrame对象：

data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'John'],
        'Age': [20, 21, 19, 20, 18],
        'Score': [90, 85, 92, 88, 95]}
df = pd.DataFrame(data)

使用groupby方法对数据进行分组，并创建新列：

df['Mean_Score'] = df.groupby('Name')['Score'].transform('mean')

上述代码中，通过groupby('Name')将数据按照Name列进行分组，然后使用transform('mean')计算每个分组的平均值，并将结果赋值给新列Mean_Score。

输出结果：

print(df)

输出结果如下：

   Name  Age  Score  Mean_Score
0   Tom   20     90        89.0
1  Nick   21     85        85.0
2  John   19     92        93.5
3   Tom   20     88        89.0
4  John   18     95        93.5

可以看到，新列Mean_Score成功地根据分组计算出了每个分组的平均值，并将结果填充到对应的行中。

Pandas的groupby方法可以灵活地对数据进行分组，并通过transform等方法实现对分组数据的操作，避免了使用循环的复杂性。这在数据分析和数据处理中非常常见，特别适用于对大规模数据进行统计和计算。

推荐的腾讯云相关产品：腾讯云服务器（CVM）和腾讯云数据库（TencentDB），可以提供稳定可靠的云计算基础设施和数据库服务，支持各类应用场景和业务需求。

腾讯云服务器（CVM）产品介绍链接地址：https://cloud.tencent.com/product/cvm 腾讯云数据库（TencentDB）产品介绍链接地址：https://cloud.tencent.com/product/cdb