文章来源:Python数据分析
1.分组 (groupby)
对数据集进行分组,然后对每组进行统计分析
SQL能够对数据进行过滤,分组聚合
pandas能利用groupby进行更加复杂的分组运算
分组运算过程:split->apply->combine
拆分:进行分组的根据
应用:每个分组运行的计算规则
合并:把每个分组的计算结果合并起来
示例代码:
运行结果:
一、GroupBy对象:DataFrameGroupBy,SeriesGroupBy
1. 分组操作
示例代码:
运行结果:
2. 分组运算
示例代码:
运行结果:
示例代码:
运行结果:
3. 按自定义的key分组
运行结果:
二、GroupBy对象支持迭代操作
1. 单层分组
示例代码:
运行结果:
2. 多层分组
示例代码:
运行结果:
三、GroupBy对象可以转换成列表或字典
示例代码:
运行结果:
1. 按列分组、按数据类型分组
示例代码:
运行结果:
2. 其他分组方法
示例代码:
运行结果:
3. 通过字典分组
示例代码:
运行结果:
4. 通过函数分组,函数传入的参数为行索引或列索引
示例代码:
运行结果:
5. 通过索引级别分组
示例代码:
运行结果:
聚合 (aggregation)
数组产生标量的过程,如mean()、count()等
常用于对分组后的数据进行计算
示例代码:
运行结果:
1. 内置的聚合函数
示例代码:
运行结果:
2. 可自定义函数,传入agg方法中
示例代码:
运行结果:
3. 应用多个聚合函数
同时应用多个函数进行聚合操作,使用函数列表
示例代码:
运行结果:
4. 对不同的列分别作用不同的聚合函数,使用dict
示例代码:
运行结果:
5. 常用的内置聚合函数
编程从未如此有趣!
领取专属 10元无门槛券
私享最新 技术干货