首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

几个高效Pandas函数

Pandas是python中最主要的数据分析库之一,它提供了非常多的函数、方法,可以高效地处理并分析数据。让pandas如此受欢迎的原因是它简洁、灵活、功能强大的语法。...Cumsum Cumsum是pandas的累加函数,用来求列的累加值。...用法: DataFrame.cumsum(axis=None, skipna=True, args, kwargs) 参数作用: axis:index或者轴的名字 skipna:排除NA/null值 以前面的...比如说dataframe中某一行其中一个元素包含多个同类型的数据,若想要展开成多行进行分析,这时候explode就派上用场,而且只需一行代码,非常节省时间。...用法: DataFrame.memory_usage(index=True, deep=False) 参数解释: index:指定是否返回df中索引字节大小,默认为True,返回的第一行即是索引的内存使用情况

1.5K60
您找到你想要的搜索结果了吗?
是的
没有找到

女朋友还是游戏?一起来分析下游戏的开发与销售情况!

为了中文能正常显示 from matplotlib import font_manager #让图片显示在交互页面 %matplotlib inline 3、代码正文 从csv文件中导入数据 pandas是作为Python...在看到年份的索引时,奇怪的出现了还未到的2020年,说明是数据错误,就需要对这一行数据进行清洗。...这里我们要获取每一年的各个地区所有游戏销售额总值,我们就要用到cumsum这个方法——cumsum方法通俗说是一个累加和,注意红框里的数据,这里是依据年份将每部游戏的销售额相加 #cumsum函数是累加和...用小脑瓜想一想,需要的数据是一年的总销售额,所以只需要保留每一年最后一行的销售额,这里可以用drop_duplicates去重,并keep参数保留最后一行即可。...我们需要一个只包含游戏类型和销售额的DataFrame对象,先用sum()方法统计,后用loc索引即可。

70530

Python数据分析笔记——Numpy、Pandas库

Python数据分析——Numpy、Pandas库 总第48篇 ▼ 利用Python进行数据分析中有两个重要的库是Numpy和Pandas,本章将围绕这两个库进行展开介绍。...还有abs、exp、sin、cos、log、sum、mean(算术平均数)、cumsum(所有元素的累计和)、cumprod(所有元素的累计积)、sort(将元素进行排序)等函数。...(2)DataFrame与Series之间的运算 将DataFrame的每一行与Series分别进行运算。...传入how=‘all’将只滤出全是缺失值的那一行。 要用这种方式滤出列,只需传入axis=1即可。...其中有求和(sum)运算、累计(cumsum)运算、平均值(mean)等运算。这些运算默认都是针对于行的运算,通过使用axis=1进行列的运算。

6.4K80

python怎么画?

###### 处理数据 ############### # 计算销售额的变化 sale['销售变化'] = sale.iloc[:, 1] - sale.iloc[:, 0] # 把销售汇总作为第一行...change = pd.concat([pd.DataFrame(sale.sum()).T, sale]) # 修改第一行的索引名称:上个月 change.rename(index={0: sale.columns...(data=data, index=index) # 为瀑布图创建空白序列,用于把柱子撑起来 blank = trans.销售变化.cumsum().shift(1).fillna(0) # 计算瀑布图的最后一个数值...neg_offset = max / 25 pos_offset = max / 50 plot_offset = int(max / 10) # 获取标签的高度位置 y_height = trans.销售变化.cumsum...虽然 Excel 也能画瀑布图,但是我个人觉得用 Python 能够更加灵活高效。 Python 能让数据分析等工作变得更加自动化、标准化、流程化。

3.4K60

Pandas知识点-统计运算函数

使用DataFrame数据调用max()函数,返回结果为DataFrame中每一列的最大值,即使数据是字符串或object也可以返回最大值。...在Pandas中,数据的获取逻辑是“先列后行”,所以max()默认返回每一列的最大值,axis参数默认为0,如果将axis参数设置为1,则返回的结果是每一行的最大值,后面介绍的其他统计运算函数同理。...根据DataFrame的数据特点,每一列的数据属性相同,进行统计运算是有意义的,而每一行数据的数据属性不一定相同,进行统计计算一般没有实际意义,极少使用,所以本文也不进行举例。...cumsum(): 对数据累计求和。累计求和是指,对当前数据及其前面的所有数据求和。...这两个函数的累计原理都与cumsum()相同,此外还有累计求积函数cumprod()等,分别有不同的应用场景。 六、综合统计函数 ?

2.1K20

Python Matplotlib中制作瀑布图

标签:Python,Matplotlib,瀑布图 我们将用Python制作瀑布图,特别是使用matplotlib库。瀑布图显示了运行总数以及增减,这对于属性分析来说是很好的选择。...Matplotlib没有像“waterfall_chart()”这样的神奇函数,使我们能够用一行代码就绘制瀑布图。然而,可以使用一点小小的技巧在Python中自定义自己的瀑布图。...import pandas as pd import matplotlib.pyplot as plt import numpy as np df= pd.DataFrame({'category':[...可以使用cumsum()方法计算一个运行总数,然后将其下移1行。这两个新的列tot和tot1为我们提供了每个瀑布条的起点和终点。例如,在第2行Expenses(费用)中,起点是110,终点是90。...df['tot']= df['num'].cumsum() df['tot1']= df['tot'].shift(1).fillna(0) 代码运行结果如下图2所示。

2.6K20

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券