展开

关键词

盘一盘 Python 特别篇 15 - Pivot Table

Pivot 字面意思是支点,即上图中的 index 和 columns 指定的行和列标签,支点可想理解成数据 (values) 在哪个维度上做整合 (aggfunc),再吧 NaN 值用 fill_value "], aggfunc=np.sum ) ? aggfunc 参数可以被设置为多个函数,用列表储存,通用语法为 pd.pivot_table(df, index=label_list, values=label_list, aggfunc=func_list 整合函数的不同设置方式 aggfunc 参数还可以传进一个字典来实现不同列下应用不同的整合函数,语法如下: aggfunc = {col_1:func_1, col_2:func_2, ... col_n 语法如下: aggfunc = {col_1:func_1, col_2:func_list, ... col_n:func_n} 假设第二列传入一个函数列表。

28620

pandas透视表分析

计算逻辑默认是对数值型变量做平均,通过参数aggfunc设置所要聚合计算的逻辑,比方说求和,最小值,最大值等。 代码 pd.pivot_table(df, index=['Manager', 'Rep'], values=['Price'], aggfunc=np.sum) 结果 ? 参数aggfunc可以接受一个聚合计算的列表,例如:求和与计数 代码 pd.pivot_table(df, index=['Manager', 'Rep'], values=['Price'], aggfunc 通过对参数aggfunc传递字典来实现对参数values里面指定的列执行所需的聚合计算操作。 常用的参数包括index, values, aggfunc, columns, fill_value, margins等。

83220
  • 广告
    关闭

    腾讯云618采购季来袭!

    一键领取预热专享618元代金券,2核2G云服务器爆品秒杀低至18元!云产品首单低0.8折起,企业用户购买域名1元起…

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    在pandas中使用数据透视表

    pandas.pivot_table(*data*, *values=None*, *index=None*, *columns=None*, *aggfunc='mean'*, *fill_value 参数aggfunc对应excel透视表中的值汇总方式,但比excel的聚合方式更丰富: ? 如何使用pivot_table? 下面拿数据练一练,示例数据表如下: ? 计算每个洲每个城市每单平均销售量 result2 = pd.pivot_table(data,index=['洲','城市'],aggfunc=np.mean,values=['数量']) result2 计算每个洲的总销量和每单平均销量 result3 = pd.pivot_table(data,index=['洲'],aggfunc=[np.sum,np.mean],values=['数量']) result3 看每个城市(行)每类商品(列)的总销售量,并汇总计算 result4 = pd.pivot_table(data,index=['城市'],columns=['商品类别'],aggfunc=[np.sum

    32340

    在pandas中使用数据透视表

    pivot_table使用方法: pandas.pivot_table(*data*, *values=None*, *index=None*, *columns=None*, *aggfunc='mean 需要汇总计算的列,可多选 index:行分组键,一般是用于分组的列名或其他分组键,作为结果DataFrame的行索引 columns:列分组键,一般是用于分组的列名或其他分组键,作为结果DataFrame的列索引 aggfunc = np.sum) result1.head() 计算每个洲每个城市每单平均销售量 result2 = pd.pivot_table(data,index=['洲','城市'],aggfunc=np.mean ,values=['数量']) result2.head(20) 计算每个洲的总销量和每单平均销量 result3 = pd.pivot_table(data,index=['洲'],aggfunc result3.head() 看每个城市(行)每类商品(列)的总销售量,并汇总计算 result4 = pd.pivot_table(data,index=['城市'],columns=['商品类别'],aggfunc

    9320

    对比Excel,学习pandas数据透视表

    用pivot_table()做数据透视表 1)语法格式 pd.pivot_table(data,index=None,columns=None, values=None,aggfunc data 相当于Excel中的"选中数据源"; index 相当于上述"数据透视表字段"中的行; columns 相当于上述"数据透视表字段"中的列; values 相当于上述"数据透视表字段"中的值; aggfunc (df.sample(5)) df1 = pd.pivot_table(df,index="品牌",columns="月份", values="销售数量",aggfunc df.sample(5)) df1 = pd.pivot_table(df,index="品牌",columns=["销售区域","月份"], values="销售数量",aggfunc pd.pivot_table(df,index="品牌",columns="月份", values=["销售数量","货号"], aggfunc

    33620

    对比Excel,学习pandas数据透视表

    用pivot_table()做数据透视表 1)语法格式 pd.pivot_table(data,index=None,columns=None, values=None,aggfunc data 相当于Excel中的"选中数据源"; index 相当于上述"数据透视表字段"中的行; columns 相当于上述"数据透视表字段"中的列; values 相当于上述"数据透视表字段"中的值; aggfunc (df.sample(5)) df1 = pd.pivot_table(df,index="品牌",columns="月份", values="销售数量",aggfunc df.sample(5)) df1 = pd.pivot_table(df,index="品牌",columns=["销售区域","月份"], values="销售数量",aggfunc pd.pivot_table(df,index="品牌",columns="月份", values=["销售数量","货号"], aggfunc

    43610

    手把手教你用Pandas透视表处理数据(附学习资料)

    要添加这些功能,使用aggfunc和np.sum就很容易实现。 pd.pivot_table(df,index=["Manager","Rep"],values=["Price"],aggfunc=np.sum) ? aggfunc可以包含很多函数,下面就让我们尝试一种方法,即使用numpy中的函数mean和len来进行计数。 然而,聚合函数aggfunc最后是被应用到了变量“values”中你所列举的项目上。 一个很方便的特性是,为了对你选择的不同值执行不同的函数,你可以向aggfunc传递一个字典。不过,这样做有一个副作用,那就是必须将标签做的更加简洁才行。

    59150

    统计绘图 | 教你一行代码教你轻松绘制统计图表(文末送书)

    width_data 「基本用法」: Dexplot库提供了用于绘制不同图表的绘图函数,但其基本使用语法如下: dxp.plotting_func(x, y, data, aggfunc, split, 「主要绘图类型」: Dexplot绘图库主要提供聚类图和分布图两种数据类型, 聚合图采用一系列值,并使用提供给aggfunc的函数返回单个值,而分布图采用一系列值并以某种方式描述分布形状。 as plt airbnb = dxp.load_dataset('airbnb') #bar01 dxp.bar(x='neighborhood', y='price', data=airbnb, aggfunc Example01 of dxp.bar 排序: dxp.bar(x='neighborhood', y='price', data=airbnb, aggfunc='median', Example02 of dxp.bar 水平: dxp.bar(x='price', y='neighborhood', data=airbnb, aggfunc='median', figsize=

    26320

    Python可视化 | 一行代码轻松绘制统计图表!

    只支持长数据),下面通过两幅图展示一下什么是长数据和宽数据: Dexplot库提供了用于绘制不同图表的绘图函数,但其基本使用语法如下: dxp.plotting_func(x, y, data, aggfunc Dexplot绘图库主要提供聚类图和分布图两种数据类型, 聚合图采用一系列值,并使用提供给aggfunc的函数返回单个值,而分布图采用一系列值并以某种方式描述分布形状。 airbnb = dxp.load_dataset('airbnb') #bar01 dxp.bar(x='neighborhood', y='price', data=airbnb, aggfunc #0073C2","ec":"black"}) Example01 of dxp.bar 排序: dxp.bar(x='neighborhood', y='price', data=airbnb, aggfunc wx_fmt=png) 水平: ```python dxp.bar(x='price', y='neighborhood', data=airbnb, aggfunc='median', figsize

    11820

    对比excel,学习pandas数据透视表

    中使用pivot_table()做数据透视表 1)语法格式 pd.pivot_table(data,index=None,columns=None, values=None,aggfunc data 相当于Excel中的"选中数据源"; index 相当于上述"数据透视表字段"中的行; columns 相当于上述"数据透视表字段"中的列; values 相当于上述"数据透视表字段"中的值; aggfunc (df.sample(5)) df1 = pd.pivot_table(df,index="品牌",columns="月份", values="销售数量",aggfunc df.sample(5)) df1 = pd.pivot_table(df,index="品牌",columns=["销售区域","月份"], values="销售数量",aggfunc pd.pivot_table(df,index="品牌",columns="月份", values=["销售数量","货号"], aggfunc

    7220

    pandas进行数据分析

    data.value_counts(subset=['消费频次'],sort=True,ascending=True) 数据统计 数据透视表 data pd.pivot_table(data,index=['性别'],aggfunc ='count') pd.pivot_table(data,index=['性别'],values=['姓名'],aggfunc='count') pd.pivot_table(data,index=[ '性别'], columns=['消费频次'], values=['姓名'], aggfunc='count', (data,index=['性别'], columns=['消费频次'], values=['消费金额'], aggfunc index=['性别'], columns=['消费频次'], values=['最近一次消费距今间隔天数'], aggfunc

    7520

    左手pandas右手Python,带你学习数据透视表

    目标5:实现对Price的求和 1.Pandas实现 pd.pivot_table(df, index=['Manager', 'Rep'], values=['Price'], aggfunc=np.sum (Excel貌似不可以设置) pd.pivot_table(df, index=['Manager', 'Rep'], columns=['Product'], values=['Price'], aggfunc pd.pivot_table(df, index=['Manager', 'Rep'], columns=['Product'], values=['Price', 'Quantity'], aggfunc pd.pivot_table(df, index=['Manager', 'Rep'], columns=['Product'], values=['Quantity', 'Price'], aggfunc 小结与备忘: index-对应透视表的“行”,columns对应透视表的列,values对应透视表的‘值’,aggfunc对应值的汇总方式。用图形表示如下: ?

    1.3K40

    Python+pandas使用交叉表分析超市营业额数据

    交叉表是一种特殊的透视表,往往用来统计频次,也可以使用参数aggfunc指定聚合函数实现其他功能。 ()函数用来生成交叉表,返回新的DataFrame,其语法为: crosstab(index, columns, values=None, rownames=None, colnames=None, aggfunc =None, margins=False, dropna=True, normalize=False) 其中,参数aggfunc用来指定聚合函数,默认为统计次数。

    1K40

    5分钟了解Pandas的透视表

    num-of-doors', columns='fuel-type', aggfunc columns=['fuel-type', 'fuel-system'], aggfunc make'], columns=['num-of-doors'], aggfunc 'horsepower'], index=['make'], aggfunc 'horsepower'], index=['make'], aggfunc

    20350

    pandas进行数据分析

    data.value_counts(subset=['消费频次'],sort=True,ascending=True) 数据统计 数据透视表 data pd.pivot_table(data,index=['性别'],aggfunc ='count') pd.pivot_table(data,index=['性别'],values=['姓名'],aggfunc='count') pd.pivot_table(data,index=[ '性别'], columns=['消费频次'], values=['姓名'], aggfunc='count', (data,index=['性别'], columns=['消费频次'], values=['消费金额'], aggfunc index=['性别'], columns=['消费频次'], values=['最近一次消费距今间隔天数'], aggfunc

    8220

    Python中的交叉分析pivot_table

    交叉计数函数: pivot_table(values,index,columns,aggfunc,fill_value) 参数说明: values:数据透视表中的值 index:数据透视表中的行 columns:数据透视表中的列 aggfunc:统计函数 fill_value:NA值的同一替换 #相当于excel中的数据透视表功能 import numpy import pandas data labels ) ptResult = data.pivot_table( values=['年龄'], index=['年龄分层'], columns=['性别'], aggfunc

    1.1K90

    Pandas进阶|数据透视表与逆透视

    默认聚合所有数值列 index 用于分组的列名或其他分组键,出现在结果透视表的行 columns 用于分组的列名或其他分组键,出现在结果透视表的列 aggfunc 聚合函数或函数列表,默认为'mean' driver_gender', 'stop_duration'], columns='driver_race') 自定义聚合函数 aggfunc data.pivot_table(index='driver_gender', columns='driver_race', aggfunc 其实在我们通过字典为 aggfunc 指定映射关系的时候,待透视的数值就已经确定了。 margin 的标签可以通过 margins_name 参数进行自定义, 默认值是 "All"。 values:指定了要聚合的值(由行列共同影响),需要指定aggfunc参数。 rownames:指定了行名称。 colnames:指定了列名称。 aggfunc:指定聚合函数。

    20710

    利用 Python 生成数据透视表

    DataFrame.pivot_table(self, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins False) values : 要进行透视展示的数据 index : 需要重新进行展示成列,是原始数据中的某一个行 columns : 要重新展示为行的内容,是原来的列或者是其它的属性,可以是列表 aggfunc : 要进行统计的行,可以是 numpy.sum / numpy.mean 等,也可以按列进行统计 aggfunc={'c1' : numpy.mean, 'c2' : numpy.sum} fill_value pd.pivot_table(data5, values="loan divide amount", columns="used", index="company", aggfunc

    62510

    相关产品

    • 云服务器

      云服务器

      云端获取和启用云服务器,并实时扩展或缩减云计算资源。云服务器 支持按实际使用的资源计费,可以为您节约计算成本。 腾讯云服务器(CVM)为您提供安全可靠的弹性云计算服务。只需几分钟,您就可以在云端获取和启用云服务器,并实时扩展或缩减云计算资源。云服务器 支持按实际使用的资源计费,可以为您节约计算成本。

    相关资讯

    热门标签

    扫码关注云+社区

    领取腾讯云代金券