Pandas分组与聚合(一)

文章来源:Python数据分析

1.分组 (groupby)

对数据集进行分组,然后对每组进行统计分析

SQL能够对数据进行过滤,分组聚合

pandas能利用groupby进行更加复杂的分组运算

分组运算过程:split->apply->combine

拆分:进行分组的根据

应用:每个分组运行的计算规则

合并:把每个分组的计算结果合并起来

示例代码:

运行结果:

一、GroupBy对象:DataFrameGroupBy,SeriesGroupBy

1. 分组操作

示例代码:

运行结果:

2. 分组运算

示例代码:

运行结果:

示例代码:

运行结果:

3. 按自定义的key分组

运行结果:

二、GroupBy对象支持迭代操作

1. 单层分组

示例代码:

运行结果:

2. 多层分组

示例代码:

运行结果:

三、GroupBy对象可以转换成列表或字典

示例代码:

运行结果:

1. 按列分组、按数据类型分组

示例代码:

运行结果:

2. 其他分组方法

示例代码:

运行结果:

3. 通过字典分组

示例代码:

运行结果:

4. 通过函数分组,函数传入的参数为行索引或列索引

示例代码:

运行结果:

5. 通过索引级别分组

示例代码:

运行结果:

聚合 (aggregation)

数组产生标量的过程,如mean()、count()等

常用于对分组后的数据进行计算

示例代码:

运行结果:

1. 内置的聚合函数

示例代码:

运行结果:

2. 可自定义函数,传入agg方法中

示例代码:

运行结果:

3. 应用多个聚合函数

同时应用多个函数进行聚合操作,使用函数列表

示例代码:

运行结果:

4. 对不同的列分别作用不同的聚合函数,使用dict

示例代码:

运行结果:

5. 常用的内置聚合函数

编程从未如此有趣!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180702G0ANXU00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券