如何对pandas中的多个列进行分组和聚合

在pandas中，可以使用groupby()函数对多个列进行分组和聚合操作。

首先，使用groupby()函数指定要分组的列名，可以是单个列名或多个列名的列表。例如，如果要按照"列1"和"列2"进行分组，可以使用以下代码：

grouped = df.groupby(['列1', '列2'])

接下来，可以使用聚合函数对分组后的数据进行聚合操作。常用的聚合函数包括sum()、mean()、count()、max()、min()等。例如，如果要计算每个分组的总和，可以使用以下代码：

result = grouped.sum()

除了使用内置的聚合函数，还可以使用自定义的聚合函数。可以通过agg()函数传入自定义的聚合函数来实现。例如，如果要计算每个分组的中位数，可以使用以下代码：

result = grouped.agg(lambda x: x.median())

在分组和聚合操作中，还可以使用transform()函数对每个分组进行转换操作，返回与原始数据相同大小的结果。例如，如果要计算每个分组的标准差，可以使用以下代码：

result = grouped.transform(lambda x: x.std())

分组和聚合操作在数据分析和数据处理中非常常见，可以用于统计汇总、数据透视表、数据切片等场景。

腾讯云提供了云原生数据库TDSQL、云数据库CDB、云数据库Redis等产品，可以满足不同场景下的数据存储和管理需求。具体产品介绍和链接如下：

云原生数据库TDSQL：适用于高性能在线事务处理（OLTP）场景，提供高可用、高性能、弹性伸缩的数据库服务。详细介绍请参考：腾讯云原生数据库TDSQL
云数据库CDB：适用于传统关系型数据库的应用场景，提供稳定可靠的数据库服务。详细介绍请参考：腾讯云数据库CDB
云数据库Redis：适用于高性能缓存和数据存储场景，提供快速、可扩展、高可用的内存数据库服务。详细介绍请参考：腾讯云数据库Redis

以上是对pandas中多个列进行分组和聚合的完善且全面的答案，希望能对您有所帮助。

如何对pandas中的多个列进行分组和聚合

、、、、

我在pandas中有以下数据帧 1 100 50 345 2 100 100 333 我想要所需格式的数据41.5 83 2 200 100 200

浏览 3提问于2018-08-02得票数 10

回答已采纳

1回答

熊猫群返回多索引和另外两个集合

、

如果按一个列分组，并使用as_index=False，这种行为在熊猫身上是可以预料的。但是，当我使用.agg时，as_index似乎不再像预期的那样运行。简而言之，这似乎并不重要。# importsimport numpy as np np.random.seed(834) aletter b

浏览 2提问于2020-10-11得票数 0

回答已采纳

3回答

Python:如何仅在Pandas中完全相似的情况下才合并重复行？

、、、

我有一个包含列Items和Ranges的数据帧。Items Ranges1 A 303 B 20 我想合并重复的行并添加范围值，但只针对完全相同的行生成的数据帧应如下所示： RangesA 60B 20 我尝试了df2 = df1.groupby(['Item

浏览 19提问于2021-04-05得票数 1

回答已采纳

1回答

如何对pandas中的动态列进行分组和聚合

、

1 10 10 123 2 2 2 12 10 现在，我想生成所有列分组的累加和nozzle_1和nozzle_2列是动态的，可以是nozzle_3、nozzle_4....nozzle_n等。我可以使用pandas中的以下代码来实现，但它很难使用列名进行编码。nozzle_1

浏览 11提问于2019-09-20得票数 0

回答已采纳

1回答

用另一个聚合行在dataframe中聚合行

、、、

以下是我的代码：data = {"uid": ['1','2','3','','3','','4','5'], "pid":['a','b','a','d','c','e','',&

浏览 1提问于2020-08-21得票数 2

回答已采纳

1回答

与agg一起使用的熊猫群不返回键列

、、

在我正在进行的项目中，我被迫使用Pandas版本1.1.5。我试图按操作进行分组，以便使用多个函数聚合变量：import numpy as np "Name"apple_median = ('Apples', np.median), apple_count = ('Apples',

浏览 4提问于2021-12-13得票数 1

回答已采纳

1回答

根据列中的值，有条件地聚合具有不同函数的分组数据框

、

，方法是对group_id进行分组，然后对每个组应用不同的聚合函数。为了确定使用哪个聚合函数，我想设置一个条件，该条件引用df中的另一个列，即condition。具体地说，我想取"ones"组的val中所有元素的和和"tens"组中所有元素的平均值。(但我不需要从condition中提取聚合函数的

浏览 21提问于2021-01-24得票数 1

回答已采纳

1回答

Python [panda/lambda] -按特定列对DF进行分组和聚合

、、、、

在DF中有多个字段： parent_path, child, level, flag, logic 我想按parent_path对DF进行分组，并收集同一父对象下的所有子对象。我得到了这样的结论： curr_level.groupby('parnet_path').agg(lambda x: list(set(x))).reset_index() 它正在工作，它确实收集了列表中具有相同父元素的所有子元素，但它还列出/

浏览 50提问于2021-01-01得票数 1

2回答

对列进行分组和聚合会复制pandas中的列

、

我使用非唯一键连接两个表left_table和right_table，这会导致行爆炸。然后，我希望聚合行以匹配left_table中的行数。为此，我对left_table列进行了聚合。奇怪的是，当我保存表时，left_table中的列加倍。似乎left_table的列变成了结果数据帧的索引…… k1 k2 s

浏览 2提问于2019-09-24得票数 0

1回答

获取第一个值，而不是GROUP BY中的聚合值

我使用GROUP BY和聚合函数来聚合表(通过多个外键、一个值列和一个四舍五入为整日的时间戳列进行分组)。但是有一列，我需要获取分组中的第一行，而不是聚合值。我看过FIRST_VALUE()，但它是一个窗口函数，而不是聚合函数。在伪代码中，我要做的是，FIRST()函数不存

浏览 1提问于2017-05-03得票数 1

2回答

通过ddply或其他R函数进行多级聚合(如“分组集”)？

、

我希望能够通过多个列进行聚合，获得的结果不仅是最好的聚合(每个分组列中有一个值)，而且还可以获得更高级别的聚合(来自一个分组列的一个值，对其他分组列没有限制，等等)。我相信Oracle和Hive可以通过“分组集”(也是Hive中的“多维数据

浏览 5提问于2014-01-26得票数 4

回答已采纳

1回答

pandas跨数据帧中的多个列对聚合进行分组

、、

我想从熊猫数据帧中推导出每年、地区和weather_type的最小和最大值。Anglia Rain需要的是两个新列，给出每个地区和年份的最小和最大值，实现跨行分组，并将结果作为两个新列添加到现有数据帧中

浏览 5提问于2020-06-23得票数 0

2回答

群熊猫数据与计算多列均值

、、、

我试图将熊猫的数据按列分组，然后计算出多个列的平均值。在下面的示例中，我想按“类别”列进行分组，然后计算“得分”和“优先级”列的平均值。所有三列都应位于生成的dataframe中。我能够对第一列进行分组并计算平均值，但我不知道如何<

浏览 3提问于2022-05-24得票数 1

回答已采纳

1回答

Pandas.DataFrame.GroupBy.agg，聚合函数中需要的独立列。如何让它进入agg？

、、

我有一个带有两级MultiIndex的Pandas DataFrame对象。此外，它显然包含许多额外的列(例如'A'，'B'，'C'，'D'，'E')。我想对DataFrame中的单个多索引执行一些聚合函数，这些索引来自可用列的子集(例如，'C'，'D'，'E'

浏览 4提问于2020-04-29得票数 0

2回答

选择多个最大值？在斯奎特？

对SQLite来说是个超级新手，但我觉得问不会有什么坏处。下面的表格(还不允许发布图像)从多个表中提取数据来计算TotalScore：Course1 15Course29我该如何选择每门课程的最大值呢？我已经设法使用了但我可能会在我的最终产品多门课程，所以限制2等不会真正帮助我。有什么想法？如果它有帮助的话，我愿意把剩

浏览 1提问于2017-05-06得票数 1

回答已采纳

1回答

Pandas:分组聚合后对列进行操作

如果我有以下df，我想按列A分组，并将列D除以每个A的最大值D。.: 'D' : np.random.randn(8)})max_by_id = df.groupby('A')['D'].max() df =

浏览 22提问于2017-01-19得票数 0

回答已采纳

2回答

熊猫合并在聚合栏上

、

然后按几个列进行分组和聚合..。)}) a4 wish 16 here 2是否可以将df与新聚合的表gb合并，以便在df中创建一个新列，其中包含来自gb的相应值？：但这就产生了错误：

浏览 5提问于2015-02-05得票数 2

回答已采纳

3回答

处理pandas的多答案调查问卷(来自Google Forms)结果

、、

我有一个谷歌表格，我用它来收集调查数据(对于这个问题，我将使用)，其中的问题可以有多个答案，使用一组复选框进行选择。23/11/2013 13:22:45 Fudge, Toffee我想对问题的结果进行统计问题是，所有的答案都在一列中，所以按该列分组</em

浏览 1提问于2013-11-23得票数 2

2回答

带有groupby的pyspark collect_set或collect_list

、、、、

在groupby之后，如何在数据帧上使用collect_set或collect_list。例如：df.groupby('key').collect_set('values')。

浏览 2提问于2016-06-02得票数 62

回答已采纳

3回答

按PostgreSQL中指定列分组

、、、

如何按指定列对记录进行分组？:)不管用..。上面写着：我应该使用哪种聚合函数？请你举个简单的<

浏览 7提问于2011-12-20得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何对pandas中的多个列进行分组和聚合

相关·内容

如何对pandas中的多个列进行分组和聚合

熊猫群返回多索引和另外两个集合

Python:如何仅在Pandas中完全相似的情况下才合并重复行？

如何对pandas中的动态列进行分组和聚合

用另一个聚合行在dataframe中聚合行

与agg一起使用的熊猫群不返回键列

根据列中的值，有条件地聚合具有不同函数的分组数据框

Python [panda/lambda] -按特定列对DF进行分组和聚合

对列进行分组和聚合会复制pandas中的列

获取第一个值，而不是GROUP BY中的聚合值

通过ddply或其他R函数进行多级聚合(如“分组集”)？

pandas跨数据帧中的多个列对聚合进行分组

群熊猫数据与计算多列均值

Pandas.DataFrame.GroupBy.agg，聚合函数中需要的独立列。如何让它进入agg？

选择多个最大值？在斯奎特？

Pandas:分组聚合后对列进行操作

熊猫合并在聚合栏上

处理pandas的多答案调查问卷(来自Google Forms)结果

带有groupby的pyspark collect_set或collect_list

按PostgreSQL中指定列分组

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐