再接着就是执行select条件,聚合函数就是写在select后面的,对比pandas就是执行agg()函数,在其中针对不同的列执行count、max、min、sum、mean聚合函数。...2)原理说明
split:按照指定规则分组,由groupby实现;
apply:针对每个小组,使用函数进行操作,得到结果,由agg()函数实现;
combine:将每一组得到的结果,汇总起来,得到最终结果...;
注意:combine这一步是自动完成的,因此针对pandas中的分组聚合,我们只需要学习两个内容,① 学习怎么分组;② 学习如何针对每个分组中的数据,进行对应的逻辑操作;
03
groupby分组对象的相关操作...① groups属性:返回一个字典,key表示组名,value表示这一组中的所有记录;
② size()方法:返回每个分组的记录数;
x = {"name":["a","a","b","b","c","...⑤ 自定义函数:将部门A、B分为一组,C单独成为一组(很特别的需求)
df = pd.DataFrame({"部门":["A", "A", "B", "B", "C", "C"],