如何在pandas中对df.groupby()使用apply()

在pandas中，可以使用df.groupby()方法对DataFrame进行分组操作，然后可以使用apply()方法对每个分组应用自定义的函数。

df.groupby()方法按照指定的列或多个列对DataFrame进行分组，并返回一个GroupBy对象。然后，可以在GroupBy对象上调用apply()方法来应用自定义的函数。

使用apply()方法时，可以传递一个函数作为参数，该函数将应用于每个分组。这个函数可以是内置函数、自定义函数或lambda函数。

下面是一个示例代码，演示如何在pandas中使用df.groupby()和apply()方法：

import pandas as pd

# 创建一个示例DataFrame
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'Nick', 'John'],
        'Subject': ['Math', 'Math', 'Math', 'Science', 'Science', 'Science'],
        'Score': [80, 90, 75, 85, 95, 70]}
df = pd.DataFrame(data)

# 使用groupby和apply计算每个学生的平均分
def calculate_average(group):
    return group['Score'].mean()

average_scores = df.groupby('Name').apply(calculate_average)
print(average_scores)

输出结果为：

Name
John    72.5
Nick    92.5
Tom     82.5
dtype: float64

在这个示例中，我们首先创建了一个包含学生姓名、科目和分数的DataFrame。然后，我们使用groupby()方法按照学生姓名进行分组。接下来，我们定义了一个名为calculate_average()的函数，该函数接收一个分组作为参数，并计算该分组的平均分数。最后，我们使用apply()方法将calculate_average()函数应用于每个分组，并打印出每个学生的平均分数。

需要注意的是，apply()方法返回一个Series对象，其中索引是分组的标签（在这个示例中是学生姓名），值是应用函数后的结果（在这个示例中是平均分数）。

对于groupby()和apply()的更多详细信息，可以参考pandas官方文档：pandas.DataFrame.groupby()和pandas.core.groupby.GroupBy.apply()。

如何在pandas中对df.groupby()使用apply()

python、pandas、dataframe、group-by、apply

我知道如何在pandas中使用groupby()来使用聚合函数，如mean、sum等，但我想知道如何使用apply()来进一步应用我想要的函数。例如，在这个数据集中有两个公司‘1’和‘2’： import pandas as pd raw_data = {'regiment': ['Nighthawks', 'Nighthawks', 'Nighthawks例如： list(

浏览 28提问于2020-08-13得票数 1

1回答

传递什么Pandas数据类型来在一个组中转换或应用

python、pandas

在尝试调试groupby函数应用程序时，我使用一个虚拟函数来为每个组“查看传递给函数的内容”的。(['category'])['data_1'].apply(f)df.groupby(['category'])[['data_1']].apply(f) print '\n

浏览 5提问于2013-12-19得票数 6

回答已采纳

1回答

使用Apply和Groupby的Lambda

python、pandas、dataframe、pandas-groupby、pandas-apply

我正在尝试计算由第二列分组的pandas数据帧的列中的唯一值，并将结果作为数据帧中的新列返回。当我在下面的dataframe上测试这个操作时，它返回空值。0.18中，我使用 df['test'] = df.groupby('class').transform('unique') Traceback (most recent call last):我查看了1.1.3的新文档，并尝试使用以下内容 df['

浏览 37提问于2020-11-24得票数 1

回答已采纳

1回答

在Pandas中使用分部和groupby

python、pandas

我很难在Pandas中使用和Pandas。也许我不是用这个对吧？(columnName, group): return len(group[group[columnName] == 'Y'])>>> def countY(columnName, group): return len(group[group[columnName] ==

浏览 2提问于2014-03-24得票数 1

回答已采纳

1回答

在每个组中优化Python

python

所以我用the，密码是：tt=df.groupby(by=["A","B"]) tt.minimize(equation,options

浏览 1提问于2020-11-05得票数 0

回答已采纳

2回答

如何将数据集与熊猫群相结合

python、pandas、dataframe、lambda、pandas-groupby

我有一个dataframe df和一个列df['table']，这样df['table']中的每一项都是具有相同标题/列数的另一个数据same。, df3, and df4Emily Pandas df5 我找到了这个代码片段，用于对数据帧中的字符串执行groupby和lambda，但是还没有找到如何在groupby中追加整个数据帧。df['table'] = df.

浏览 0提问于2020-10-07得票数 7

回答已采纳

1回答

将熊猫转换成dask代码，就会出错

pandas、dask

df.groupby(["Name"]).apply(lambda x: x.to_json(orient="records")).reset_index(.apply(func, meta=('x', 'f8')) for series result df.groupby(["Name"]).apply(lambda x: x.to_json(courses_df, nparti

浏览 10提问于2022-03-07得票数 0

回答已采纳

2回答

Pandas: Groupby填充消失列

pandas

我的代码如下： df.groupby(["col1"], as_index=False).fillna(method="ffill")

浏览 3提问于2021-05-01得票数 0

1回答

获取具有行条件的最大值列

python、pandas、pandas-groupby

我想根据pandas dataframe中的2列获取最大值。我设法根据1个专栏而不是2个来做到这一点。对于1列： import numpy as npmaxes = df.groupby(["name"]).agg("max") df["m

浏览 14提问于2020-09-11得票数 1

回答已采纳

3回答

Pandas GroupBy.apply方法复制第一组

python、pandas、group-by、pandas-groupby

我的第一个问题是:我对pandas (0.12.0-4)中groupby的应用方法的行为感到困惑，它似乎将函数应用于数据帧的第一行两次。例如：>>> import pandas as pd>>> def

浏览 2提问于2014-01-28得票数 42

回答已采纳

2回答

当使用'df.groupby( column ).apply()‘时，在'apply’上下文中获取groupby列？

pandas、dataframe、group-by、apply

我想在groupby (即df.groupby(by=column).apply(Here))之后的apply上下文中获取groupby列，即作为by参数(即df.groupby(by=column))提供给df.groupby的列。'Parrot', 'Parrot'],df.groupby(['Ani

浏览 43提问于2021-10-17得票数 1

回答已采纳

1回答

groupby和apply时如何将列名作为参数传递

python、pandas、apply

在python pandas中，何时执行df.groupby('columnA').apply(myfunction)，如何将columnA传递给函数？columnA中的值将用于进一步的数据过滤。我已经在下面尝试过了，但不起作用提前感谢！

浏览 4提问于2019-06-27得票数 0

1回答

如何在通过groupby.apply创建新列时避免临时变量

pandas

的结果，我想在dataframe newcol中创建一个新列df。df.groupby('keycol').apply(somefunc)df['newcol'] = df.groupby('keycol').apply(somefunc)import pandas as pd df['newcol'] = pd.Series(d

浏览 4提问于2014-11-11得票数 2

1回答

在多栏大熊猫上应用“列表”函数

python、list、pandas、apply

为了将Pandas中的groupby“连接”几行到一个列表，我可以这样做：我

浏览 0提问于2016-11-01得票数 3

回答已采纳

3回答

熊猫群应用函数与一系列函数

python、pandas、group-by、data-science、feature-engineering

目前我是这样做的：df1 = df1.to_frame()df1['Category_B'] = df.groupby(['S

浏览 1提问于2021-03-23得票数 1

回答已采纳

8回答

熊猫在所有栏目中都有群数。

python、pandas

展示了如何为特定的C列计算数据中的NAs。如何对所有列(不是groupby列)计算NAs？#!/usr/bin/env python3 import numpy as np 'c':[1,np.nan,2,3]}) # r

浏览 2提问于2019-09-18得票数 4

回答已采纳

1回答

Pandas Groupby，用于整数值的Group Concat

python-3.x、pandas、pandas-groupby

我的pandas dataframe看起来像这样，我希望按键对它进行分组，并连接id的逗号分隔，然后创建一个新的dataframe。现在这里的问题是id列是整数。id 1 abcd 5025923,5096021,5032121df.groupby('key').apply(lambda x:

浏览 5提问于2017-12-17得票数 4

2回答

Python、Pandas、DataFrame，添加与SQL GROUP_CONCAT等效的列

python、pandas、dataframe

| 在原始主题中，可以通过以下任意一种方式来实现：df.groupby('team').apply(lambda x: list(x.user)) df.groupby('team').agg({'user&

浏览 0提问于2021-01-09得票数 1

1回答

Groupby和shift a dask数据帧

python、dask

我想使用dask 2.14扩展我在熊猫数据帧上所做的一些操作。shift(-1) 但是我得到了AttributeError: 'SeriesGroupBy' object has no attribute 'shift'，我读了dask文档，我发现没有这样的方法(虽然在pandas

浏览 7提问于2020-05-05得票数 5

回答已采纳

1回答

sum vs np.nansum怪异，同时在熊猫的dataframe - python上求和同名列

pandas、dataframe、group-by、multiple-columns

从这里对SO ()的讨论中汲取灵感，我尝试了所建议的方法，虽然它在使用函数sum()时有效，但在使用np.nansum时却不起作用：import numpy as=['a', 'a','b','b'], index=pd.date_range('2011-1-1', periods=100))sum()案件： print(<em

浏览 1提问于2016-09-07得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何在pandas中对df.groupby()使用apply()

相关·内容

如何在pandas中对df.groupby()使用apply()

传递什么Pandas数据类型来在一个组中转换或应用

使用Apply和Groupby的Lambda

在Pandas中使用分部和groupby

在每个组中优化Python

如何将数据集与熊猫群相结合

将熊猫转换成dask代码，就会出错

Pandas: Groupby填充消失列

获取具有行条件的最大值列

Pandas GroupBy.apply方法复制第一组

当使用'df.groupby( column ).apply()‘时，在'apply’上下文中获取groupby列？

groupby和apply时如何将列名作为参数传递

如何在通过groupby.apply创建新列时避免临时变量

在多栏大熊猫上应用“列表”函数

熊猫群应用函数与一系列函数

熊猫在所有栏目中都有群数。

Pandas Groupby，用于整数值的Group Concat

Python、Pandas、DataFrame，添加与SQL GROUP_CONCAT等效的列

Groupby和shift a dask数据帧

sum vs np.nansum怪异，同时在熊猫的dataframe - python上求和同名列

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐