文章/答案/技术大牛

发布

可以将python pandas中的groupby应用到已经分组的对象上吗？

是的，可以将Python pandas中的groupby应用到已经分组的对象上。

在pandas中，groupby函数用于按照指定的列或多个列对数据进行分组。它返回一个GroupBy对象，可以对该对象应用各种聚合函数（如sum、mean、count等）来计算分组后的统计结果。

当已经有一个GroupBy对象时，可以继续对其进行分组操作。例如，可以使用get_group方法获取指定分组的数据子集，或者使用agg方法对分组后的数据进行聚合操作。

以下是一个示例代码：

import pandas as pd

# 创建一个DataFrame
data = {'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
        'B': ['one', 'one', 'two', 'two', 'two', 'one', 'two', 'one'],
        'C': [1, 2, 3, 4, 5, 6, 7, 8],
        'D': [10, 20, 30, 40, 50, 60, 70, 80]}
df = pd.DataFrame(data)

# 对A列进行分组
grouped = df.groupby('A')

# 对分组后的对象继续进行分组操作
sub_grouped = grouped.groupby('B')

# 获取指定分组的数据子集
subset = sub_grouped.get_group(('foo', 'one'))
print(subset)

# 对分组后的数据进行聚合操作
aggregated = sub_grouped.agg({'C': 'sum', 'D': 'mean'})
print(aggregated)

在上述示例中，首先对DataFrame对象df按照列'A'进行分组，得到一个GroupBy对象grouped。然后，对grouped对象再次按照列'B'进行分组，得到一个新的GroupBy对象sub_grouped。可以通过get_group方法获取指定分组的数据子集，也可以使用agg方法对分组后的数据进行聚合操作。

对于pandas的groupby功能，腾讯云提供了云原生数据库TDSQL和云数据库CynosDB等产品，可以帮助用户在云上快速搭建和管理数据库，实现数据的存储和分析。具体产品介绍和链接如下：

腾讯云原生数据库TDSQL：是一种高性能、高可用、弹性伸缩的云原生数据库，支持MySQL和PostgreSQL引擎。它提供了分布式事务、自动备份、自动故障恢复等功能，适用于各种规模的应用场景。了解更多信息，请访问TDSQL产品介绍。
腾讯云数据库CynosDB：是一种全托管的云原生数据库，支持MySQL和PostgreSQL引擎。它提供了自动备份、自动故障恢复、自动扩缩容等功能，可以轻松应对高并发和大规模数据存储的需求。了解更多信息，请访问CynosDB产品介绍。

通过使用腾讯云的云数据库产品，用户可以方便地存储和管理数据，并利用pandas的groupby功能进行数据分析和统计。

可以将python pandas中的groupby应用到已经分组的对象上吗？

、、、

4 3 24-1-2019 1 4 5 8 2 3 25-1-2019 1 4 我想根据日期和批次对数据列'A‘和'B’进行分组然后根据文件编号的顺序对这些列的行进行移位。例如，在上面的数据帧文件中，4号文件丢失。我可以实现移位功能，但我不能单独为每个组执行该功能。例如:6&8文件不是按顺序排列的，但它们来自不同的日期。diff = data['File_

浏览 10提问于2019-05-09得票数 1

回答已采纳

1回答

将4个参数的函数应用于groupby对象

、

我有一只包含经度和纬度的熊猫数据，它是由标识符决定的。 d = {'col1': ['a','a',&#

浏览 2提问于2019-12-15得票数 1

回答已采纳

1回答

当DataFrame包含对象时，熊猫群按数字函数强迫数值为对象

、

我在DataFrame上使用Pandas函数，它具有混合类型(数值和对象)。>>> ... "sales": {>>> Blah objectsales float64当我将

浏览 4提问于2014-05-01得票数 2

回答已采纳

1回答

在多个轴上的groupby()上的Pandas* - cumsum()*

、

当我只需要按一个轴进行分组时-它工作得很好： df['horse_win_count'] = df.groupby(['Horse'])['win'].cumsum()df['HorseWinPercentage'] = df.groupby('Horse')['HorseWinPercentage2'].shift(+1) 然而，当我需要对多

浏览 16提问于2019-09-25得票数 1

1回答

每天过滤熊猫数据

、、、、

我有一个以分钟为单位的外汇数据框架，长达一年(371635行)：01.05188 1.05200 1.05188 1.05200我想要过滤每天的数据来得到一个小时的范围我怀疑每一步这条线正在寻找数据集中每一行的</em

浏览 0提问于2018-11-09得票数 7

回答已采纳

1回答

Pandas如何在Groupby-Apply中不包含分组索引

在Pandas中，如果我执行groupby-apply操作并查看每个'groupby‘对象，则分组索引将被保留。['age','education']同时出现在索引和返回中的值上。这对我来说是多余的，使用起来也很笨拙。有没有办法不把分组索引包含在'groupby‘对象中？dropindex()，但我只是想

浏览 1提问于2017-11-14得票数 2

3回答

熊猫.groupby将返回一个地址

、、

我真的不明白为什么在为“课程”创建一个带有groupby的Dataframe时，我会得到一个入口位置输出？代码：technologies = ({ 'Courses':["Spark","PySpark","Hadoop","Python","Pandas","Hadoop","Spark",&

浏览 22提问于2022-10-22得票数 0

回答已采纳

1回答

Python Pandas groupby应用lambda参数

、、、

在一段关于Python Pandas groupby的coursera视频中(在Python中的数据科学入门课程中)，给出了以下示例： df.groupby('Category').apply(lambda如果我理解正确的话，调用apply函数的groupby对象(由groupby返回)是一系列元组，由分组依

浏览 3提问于2017-11-29得票数 12

回答已采纳

1回答

按日期绘制分组数据

、

我正在尝试绘制一些pandas数据帧列的计数，按日期分组：数据是正确的，但是我指定的data.index.day不适合绘图：有没有一种方法可以指定我想按Python Date对象分组，或者我这样做是完全错误的？更新: Dan Allan的resample建议起作用了

浏览 1提问于2013-05-03得票数 2

回答已采纳

1回答

如何在python中按添加的列进行分组

、

以前，我可以将excel文件作为df文件读取到python中，其中包含一个名为date的列，格式类似于2011-02-01，我希望获得每个日期的季度，并按季度的数据分组。我已经向df中添加了一个名为quarter的列，但是当我尝试它向我展示了 No axis named quarter for object type

浏览 0提问于2016-05-23得票数 0

1回答

如何对与Pandas创建的每个组相关的一系列数据求和？

、、

在Python pandas数据框中，假设我使用pandas groupby()方法对数据进行分组，结果如下：我如何从Third列中分别计算每个组(这里是A和B)的值的总和，这样我就可以在一个单元格中获得每个主要组的总和值例如，我可以将12+32+43放在组A的新单元格中，将145+231+123放在组

浏览 0提问于2018-08-05得票数 0

1回答

熊猫-多栏群

、

/dist-packages/pandas/core/groupby.pyc in _python_agg_general(self, func, *args, **kwargs) 1633 return self.): /usr/local/lib/<

浏览 0提问于2015-11-13得票数 3

回答已采纳

2回答

在使用groupby应用生成系列时保留DataFrame的索引

、、

当使用groupby + apply调用函数时，我想从DataFrame转到Series groupby对象，将一个函数应用到每个以Series作为输入并返回Series作为输出的组，然后将groupby+ apply调用中的输出分配为DataFrame中的字段。默认行为是将来自groupby + apply的输出按分组字段进行

浏览 2提问于2017-02-11得票数 4

回答已采纳

4回答

使用带参数的分组Map Pandas* UDF*

、、、

我希望使用data.groupby.apply()将函数应用到每个组的Pyspark的每一行。我还尝试了在这个问题中提出的解决方案(对熊猫数据格式) @pandas_udf(schema,PandasUDFType.GROUPED_

浏览 0提问于2019-04-30得票数 22

1回答

如何将扩展窗口应用于groupby结果的名称？

、

我想使用pandas将数据帧按一列分组，然后对这些组运行扩展窗口计算。想象一下下面的数据帧： G ValA 1B 3C 5 C 7 我正在寻找的是一种按列G对数据进行分组的方法(结果是组['A', 'B', 'C'])，然后将函数首先应用到组A中的项，然后应用到组A和B中的

浏览 14提问于2021-11-15得票数 0

回答已采纳

1回答

.sum groupby.mean()告诉我“没有要聚合的数值类型”--但是Pandas* ()可以工作*

、

我在Python 3中的Pandas中工作。出于某种原因，我可以分组，然后对我的数据帧求和()：both 1.842neu 496.026Name: pos, dtype: float64 但是，当我将</em

浏览 540提问于2018-09-12得票数 0

回答已采纳

1回答

为什么重铸一个熊猫群对象作为一个数据数据写到excel？

、、

如果我将csv文件读入熊猫的dataframe中，然后使用groupby (pd.groupby(column1，.))，为什么不能在新的分组对象上调用to_excel属性。import pandas as pddata2 = data.groupby(['column1', 'column2&

浏览 5提问于2015-12-29得票数 2

回答已采纳

1回答

查找至少某个值的第一个值

、

我在这上面花了几个小时，所以任何帮助都将是令人惊讶的！我有一个熊猫数据帧df。然后我按其中一列(A)分组，关注另一列(B)，并获得每组的平均值： group_mean = df.groupby('A').B.agg('mean') group = df.groupby('A').B 按照上面的顺序，以下是python报告的类型： <class 'pandas.core.ser

浏览 2提问于2021-09-04得票数 0

3回答

使Pandas群的行为类似于itertools群

、、

'6'], 我可以使用轻松地对数字和组密钥进行分组现在假设我有与我的dict等价的Pandas</

浏览 1提问于2015-09-20得票数 16

回答已采纳

2回答

&应用行和函数

、

ID A B 1 3 3/9 2 1 1/3我试图用apply命令编写自己的函数，但总是会出现错误。def row_sum(input): return sum 有什么想法吗？我能把它写到一个类和方法

浏览 1提问于2021-11-26得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

可以将python pandas中的groupby应用到已经分组的对象上吗？

相关·内容

可以将python pandas中的groupby应用到已经分组的对象上吗？

将4个参数的函数应用于groupby对象

当DataFrame包含对象时，熊猫群按数字函数强迫数值为对象

在多个轴上的groupby()上的Pandas* - cumsum()*

每天过滤熊猫数据

Pandas如何在Groupby-Apply中不包含分组索引

熊猫.groupby将返回一个地址

Python Pandas groupby应用lambda参数

按日期绘制分组数据

如何在python中按添加的列进行分组

如何对与Pandas创建的每个组相关的一系列数据求和？

熊猫-多栏群

在使用groupby应用生成系列时保留DataFrame的索引

使用带参数的分组Map Pandas* UDF*

如何将扩展窗口应用于groupby结果的名称？

.sum groupby.mean()告诉我“没有要聚合的数值类型”--但是Pandas* ()可以工作*

为什么重铸一个熊猫群对象作为一个数据数据写到excel？

查找至少某个值的第一个值

使Pandas群的行为类似于itertools群

&应用行和函数

扫码

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐