Pandas分组统计
本文介绍的是pandas库中如何实现数据的分组统计:
不去重的分组统计,类似SQL中统计次数
去重的分组统计,类型SQL的统计用户数,需要去重
模拟数据1
本文案例的数据使用的是...模拟数据2
数据
import pandas as pd
df = pd.DataFrame({
'group': [1, 1, 2, 3, 3, 3, 4],
'param': ['...a', 'a', 'b', np.nan, 'a', 'a', np.nan]
})
分组统计方法1
直接使用groupby函数和nunique方法:
?...type(df1) # df1的类型是Series型数据
3、使用from_records方法来生成数据
?
4、通过stack方法进行翻转
?...from_records方法
下面记录pandas中from_records方法的使用:
参数
DataFrame.from_records(data, index=None, exclude=None