专栏首页悠扬前奏的博客Pandas-6.描述性函数

Pandas-6.描述性函数

对Pandas中常用的描述性函数做一下记录: 拿一个DataFrame:

import pandas as pd
import numpy as np

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack',
   'Lee','David','Gasper','Betina','Andres']),
   'Age':pd.Series([25,26,25,23,30,29,23,34,40,30,51,46]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8,3.78,2.98,4.80,4.10,3.65])}


#Create a DataFrame
df = pd.DataFrame(d)
'''
    Name    Age Rating
0   Tom 25  4.23
1   James   26  3.24
2   Ricky   25  3.98
3   Vin 23  2.56
4   Steve   30  3.20
5   Minsu   29  4.60
6   Jack    23  3.80
7   Lee 34  3.78
8   David   40  2.98
9   Gasper  30  4.80
10  Betina  51  4.10
11  Andres  46  3.65
'''
  • describe() 显示数据摘要,可以传递include等参数来选择显示内容
df.describe()
'''
    Age Rating
count   12.000000   12.000000
mean    31.833333   3.743333
std 9.232682    0.661628
min 23.000000   2.560000
25% 25.000000   3.230000
50% 29.500000   3.790000
75% 35.500000   4.132500
max 51.000000   4.800000
'''
  • count()非空观测数量
df.count()
'''
Name      12
Age       12
Rating    12
dtype: int64
'''
  • sum()所有值的和,可以看到字符串被串联起来了
df.sum()
'''
Name      TomJamesRickyVinSteveMinsuJackLeeDavidGasperBe...
Age                                                     382
Rating                                                44.92
dtype: object
'''
  • mean() 所有值的平均值,可以看到字符串不能算平均值,跳过了
df.mean()
'''
Age       31.833333
Rating     3.743333
dtype: float64
'''
  • median()所有值的中位数
df.median()
'''
Age       29.50
Rating     3.79
dtype: float64
'''
  • mode 众数,注意可能有多个众数,所以是个DataFrame
df.mode()
'''

Name    Age Rating
0   Andres  23.0    2.56
1   Betina  25.0    2.98
2   David   30.0    3.20
3   Gasper  NaN 3.24
4   Jack    NaN 3.65
5   James   NaN 3.78
6   Lee NaN 3.80
7   Minsu   NaN 3.98
8   Ricky   NaN 4.10
9   Steve   NaN 4.23
10  Tom NaN 4.60
11  Vin NaN 4.80
'''
  • std() 值的标准差
df.std()
'''
Age       9.232682
Rating    0.661628
dtype: float64
'''
  • min() 所有值的最小值
df.min()
'''
Name      Andres
Age           23
Rating      2.56
dtype: object
'''
  • max() 最大值
df.max()
'''
Name      Vin
Age        51
Rating    4.8
dtype: object
'''
  • abs() 绝对值
df.Age.abs()
'''
0     25
1     26
2     25
3     23
4     30
5     29
6     23
7     34
8     40
9     30
10    51
11    46
Name: Age, dtype: int64
'''
  • prod() 数组元素的乘积
df.prod()
'''
Age       7.158408e+17
Rating    6.320128e+06
dtype: float64
'''
  • cumsum()累计总和
df.iloc[:,1:].cumsum()
'''

Age Rating
0   25.0    4.23
1   51.0    7.47
2   76.0    11.45
3   99.0    14.01
4   129.0   17.21
5   158.0   21.81
6   181.0   25.61
7   215.0   29.39
8   255.0   32.37
9   285.0   37.17
10  336.0   41.27
11  382.0   44.92

'''
  • cumprod()累计乘积
df.iloc[:,1:]. cumprod()
'''

Age Rating
0   2.500000e+01    4.230000e+00
1   6.500000e+02    1.370520e+01
2   1.625000e+04    5.454670e+01
3   3.737500e+05    1.396395e+02
4   1.121250e+07    4.468465e+02
5   3.251625e+08    2.055494e+03
6   7.478738e+09    7.810877e+03
7   2.542771e+11    2.952512e+04
8   1.017108e+13    8.798485e+04
9   3.051325e+14    4.223273e+05
10  1.556176e+16    1.731542e+06
11  7.158408e+17    6.320128e+06
'''

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Pandas-8. 重建索引

    以上代码df1应该是3列10行,之后和df2对齐。 对齐操作列名应该匹配,无法对齐的列整列置为NAN。

    悠扬前奏
  • LeetCode-10.正则表达式匹配

    给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

    悠扬前奏
  • Java并发-11.管道输入/输出流

    悠扬前奏
  • 屏蔽掉向日葵的有效方法

    当然,为我们提供便利的同时也带了一定的安全隐患。所以很多地方都会要求不能使用此类远程控制软件。为了满足如上要求,今天对其网络行为进行了抓包测试,有如下手段可以达...

    yumusb
  • Facebook发布张量理解库,自动编译高性能机器学习核心

    ? Facebook AI Research今天发布了张量理解(Tensor Comprehension),这是一个C ++库,也是一种数学语言,它能够自动、...

    量子位
  • 三角形面积

    输入每行是一组测试数据,有6个整数x1,y1,x2,y2,x3,y3分别表示三个点的横纵坐标。(坐标值都在0到10000之间) 输入0 0 0 0 0 0表示输...

    书童小二
  • Oracle推出企业级区块链云服务

    使组织能够安全地扩展业务应用程序和流程,加速跨伙伴生态系统的事务。 ? 为了让客户能够利用当今最具颠覆性的新兴技术之一,甲骨文公司今天宣布了Oracle区块链云...

    首席架构师智库
  • PNAS:近红外研究:产前农药暴露的青少年的大脑激活情况

    在萨利纳斯母亲和儿童健康评估中心(CHAMACOS),我们报告了产前接触有机磷农药(OP)与较差的认知功能和行为问题之间的一致性关联。然而,几乎没有证据表明OP...

    用户1279583
  • 高可用的Redis主从复制集群,从理论到实践

    我们都知道,服务如果只部署一个节点,很容易出现单点故障,从而导致服务不可用。所以服务做成高可用是很有必要的,Redis服务自然也是这样。本文主要从理论和实践两方...

    用户2781897
  • oracle扩容数据库表空间unable to extend lob segment

    描述:现场突然反馈回来说系统运行好好的出故障了,没有日志,也不报错,就是进不了系统。搜集最近 的一次日志发现,有ora-01691的错误问题。 查看错误信息发...

    挑战者

扫码关注云+社区

领取腾讯云代金券