前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一个函数、一个案例,手把手带你学习Pandas统计汇总函数!

一个函数、一个案例,手把手带你学习Pandas统计汇总函数!

作者头像
快学Python
发布2021-08-09 14:47:53
1K0
发布2021-08-09 14:47:53
举报
文章被收录于专栏:快学Python快学Python

人生苦短,快学Python!

前几天看到一篇文章,给大家列出了Pandas的常用100函数,并将这100个函数分成了6类:统计汇总函数数据清洗函数数据筛选绘图与元素级运算函数时间序列函数和其他函数

但是只是单纯的罗列,并没有给出使用说明,相信很多朋友看了还是不会。

因此,今天这个文章,我将会带大家用 "案例教学" 的方式,学会这100个Pandas函数。

限于篇幅,为了方便大家学习,我这里先分类教学。今天为大家讲述统计汇总函数中的26个函数。

注明: 由于实际问题中,表格数据每一行代表一个样本,每一列代表一个字段,一般情况下对行操作的意义不大,主要是对每个不同列进行操作。因此,下面我们仅讲述对列的操作。

为了讲述这些函数,我们先构造一些数据源,方便我们用于操作。

代码语言:javascript
复制
import numpy as np
import pandas as pd

data = [[1, 2, np.nan], [2, np.nan, 3], [7, 8, 9], [3, 4, 5]]
date_range = pd.date_range(start="20180701", periods=4)
df1 = pd.DataFrame(data=data, index=date_range,
                   columns=['a', 'b', 'c'])
df1

df2 = pd.DataFrame({'Q':['LI','ZHANG','ZHANG','LI','WANG'], 
                   'A' : [1,1,1,2,2], 
                   'B' : [1,-1,0,1,2], 
                   'C' : [3,4,5,6,7]})
df2

df3 = pd.DataFrame({"id":[f"00{i}" for i in range(1,8)],
                   "score":[2,3,4,5,6,7,8]})
df3

df4 = pd.DataFrame({"姓名":["张三","李四","王五","赵六","沈七"],
                    "语文":[85,85,85,95,90],
                    "数学":[90,65,75,80,55],
                    "外语":[55,50,40,55,40]})
df4

1. max和min

min():计算最小值;max():计算最大值;

2. sum

sum():求和;

3. mean

mean():求均值;

4. count

count():计数(统计非缺失元素的个数);

5. size

size:计数(统计所有元素的个数);

6. median

median():计算中位数;

7. var

var():计算方差;

8. std

std():计算标准差;

9. quantile

quantile():计算任意分位数;

10. mode

mode():计算众数;

11. describe

describe():描述性统计(一次性返回多个统计结果);

12. groupby、aggregate

groupby():分组;aggregate():聚合运算(可以自定义统计函数);

上面已经很清楚为大家展示了,分组后的数据形式。其实一旦使用groupby后,系统会自动为你分组,然后我们就可以分别对分组后的数据,进行操作,比如下面这个案例。

13. argmin、argmax

argmin():寻找最小值所在位置;argmax():寻找最大值所在位置;

注意:这两个函数,用于函数删选,很有用。

14. any、all

any():返回是否所有元素都为真;all():返回是否至少一个元素为真;

上述代码的意思:判断班级各科成绩是否都在60分以上。

15. value_counts

value_counts():频次统计;

16. cumsum、cumprod

cumsum():运算累计和;cumprod():运算累计积;

17. pct_change

pct_change():运算比率(后一个元素与前一个元素的比率);

运算规律是:(后一个值 - 前一个值) / 前一个值;

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-07-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 快学Python 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. max和min
  • 2. sum
  • 3. mean
  • 4. count
  • 5. size
  • 6. median
  • 7. var
  • 8. std
  • 9. quantile
  • 10. mode
  • 11. describe
  • 12. groupby、aggregate
  • 13. argmin、argmax
  • 14. any、all
  • 15. value_counts
  • 16. cumsum、cumprod
  • 17. pct_change
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档