首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

超全整理100个 Pandas 函数,建议收藏!

人生苦短,快学Python! 今天给大家整理了100个Pandas常用的函数。 分别分为6类:统计汇总函数、数据清洗函数、数据筛选、绘图与元素级运算函数、时间序列函数其他函数。...统计汇总函数 函数 含义 min() 计算最小 max() 计算最大 sum() 求和 mean() 计算平均值 count() 计数(统计非缺失元素的个数) size() 计数(统计所有元素的个数...argmax() 寻找最大所在位置 any() 等价于逻辑“或” all() 等价于逻辑“与” value_counts() 频次统计 cumsum() 运算累计 cumprod() 运算累计积...() 替换(不可使用正则) str.replace() 替换(可使用正则) str.split.str() 字符分隔 数据筛选函数 函数 含义 isin() 成员关系判断 between()...() 转为字典 tolist() 转为列表 unique() 元素排

1.2K30

大数据分析工具Power BI(七):DAX使用场景及常用函数

操作如下: 同样的方式我们也可以创建可视化表将"门店信息表"的"商圈类型"与"总营收金额"展示在一起,如下: 并且还可以点击两表不同的行进行联动,如下: 二、计数统计 Power BI中用于计数的函数有两个...度量值拖入到之前创建的"多行卡",操作如下: 除了以上计数的需求外,在数据分析时我们还需要进行去统计,这就需要用到DISTINCTCOUNT函数,DISTINCTCOUNT函数的用法如下: DISTINCTCOUNT...六、累计统计 Power BI针对时间维度进行累计统计也是常见的场景,例如统计每月累计交易额、统计每个季度累计交易额等,这就要使用到累计相关的DAX函数,累计相关的DAX函数有三个:TOTALYTD...完成以上需求首先创建"年累计营收"度量值,并输入度量值DAX公式:年累计营收 = TOTALYTD('度量值表'[总营收金额],'动态日期表'[Date]) "报表"视图中创建创建可视化"矩阵",动态日期依次选择..."季度""月份"设置为列,度量值表中将刚刚创建的"年累计营收"设置为,绘制可视化图如下: 按照以上同样的方式,创建"季累计营收""月累计营收"度量值,并输入对应的度量值DAX公式为: TOTALQTD

8.2K32
您找到你想要的搜索结果了吗?
是的
没有找到

超全的 100 个 Pandas 函数汇总,建议收藏

统计汇总函数 函数 含义 min() 计算最小 max() 计算最大 sum() 求和 mean() 计算平均值 count() 计数(统计非缺失元素的个数) size() 计数(统计所有元素的个数...argmax() 寻找最大所在位置 any() 等价于逻辑“或” all() 等价于逻辑“与” value_counts() 频次统计 cumsum() 运算累计 cumprod() 运算累计积...() 替换(不可使用正则) str.replace() 替换(可使用正则) str.split.str() 字符分隔 数据筛选函数 函数 含义 isin() 成员关系判断 between()...含义 append() 序列元素的追加(需指定其他序列) diff() 一阶差分 round() 元素的四舍五入 sort_values() 排序 sort_index() 索引排序 to_dict...() 转为字典 tolist() 转为列表 unique() 元素排 ----

1.3K20

手把手教你Excel数据处理!

复数据处理 对于表的重复数据,可采用函数法、高级筛选法、条件格式法、数据透视表、删除重复项等方法进行查看删除,这些方法有的只能用于查看重复但不方便删除,有的能直接删除但不体现重复是什么,还有的既能体现重复还能实现重复的删除...“重复标记2”是以当前记录及其之前记录为计数范围,记录当前记录是否重复及重复次数,通过此标记可以得到大于1的记录都是重复记录,等于1的记录即为去之后的记录。 ?...数据透视表法(查看+删除) 此法是利用数据透视表实现重复数据的查看删除的,菜单栏中选择插入数据透视表,可以放置新工作表,也可以指定位置放在现有工作表。 ?...将姓名字段拖拽至行处,即可实现数据记录及其重复次数的展示,计数项中大于1的即为重复数据,行标签的记录即为去后的数据记录。这种方法可同时实现重复记录重复次数的统计和数据去。 ? e....以上所述,数据拆分可分为字段拆分随机抽样。 1.

3.5K20

能写数据后台,需要掌握哪些进阶的sql语句?

举个实例来拆解元知识点 本篇笔记,我也先举一个实例用作知识点拆解,如下,该述语句的作用是:统计每天具有学习行为的用户数。注:学习行为其实包含多种具体的行为,分布两个表。...python不同的地方。...) as 累计用户数 而count(1),count(*) count(column_name) 不同情况下,运行效率不同。...有过留言行为的累计用户数,则在全时段内去。只要该用户曾有过留言行为,则计数1,不再重复计数。...group by指定数据哪些字段分组,很多报表日统计。前面举例无形也用了该方法数次,就不单独举例啦。 多表联合查询 最后说明下,相对复杂的多表查询。

1.2K30

数据分析从零开始实战 (六)

这意味着OpenRefine对于增加行内容表现不佳,但对于探索、清洗、整合数据却功能强大,主要用于快速筛选数据、清理数据、排、分析时间维度上的分布与趋势等。...(3)第二步我们可以看出服务地址是http://127.0.0.1:3333/,浏览器内访问即可打开OpenRefine,如果你老表(小编本人绰号)一样英语不好的话,我建议你使用谷歌浏览器打开,可以自动翻译页面内容...我们仔细观察显示结果会发现,有很多其实是一个城市,只是所处州邮政编码不同导致统计的时候误认为是两个城市了,所以我们计数据前需要处理一下数据。 ?...原数据是记录2008.5.15-2008.5.21之间商品的交易信息,通过这个结果我们可以明显看出,在这期间SACRAMENTO交易次数是最多的,其次是ELK GROVE,这比我们Python里用代码处理数据计数好多了...a、点击 stree左边的倒三角形 b、点击 Edit cells-> Blank down Blank down表示:使重复数据的位置变成空(用于去除重复数据); Fill down表示:如果某数据位置为空

1.5K20

Numpy

NumPy 可以用于数值计算的一个重要原因是因为他能处理大数组的数据: 连续的内存块储存数据,独立于其他 Python 内置对象(C 语言编写的算法库, C 的基础上封装) 可以整个数组上执行复杂的计算...#lexsort函数只接收一个参数,即(a,b,c) print('排序后的数组为:\n',list(zip(a[d],b[d],c[d]))) #多个键值排序时按照最后一个传入数据确定排序顺序 去复数据...去:unique函数可以找出数组的唯一并返回排序后的结果 np.unique(ar, return_index=False, return_inverse=False, return_counts...(arr))#去并排序 arr=arr.reshape(3,4) print('改变形状后的数组为:\n',arr) print('改变形状后的数组去后为:',np.unique(arr)) 重复数据...=False)(返回索引) 累计——ndarray.cumsum(axis=None, dtype=None, out=None) 累计积——ndarray.cumprod(axis=None, dtype

1.1K10

一句Python,一句R︱pandas模块——高级版data.frame

简单统计量/计数 df.mean(axis=0,skipna=True) =R=apply(df,2,mean) #df的pop,列求均值,skipna代表是否跳过均值axis=0,skipna=True...样本的峰度(四阶矩) cumsum 样本累计 cummin , cummax 样本累计最大累计最小 cumprod 样本累计积 diff 计算一阶差分(对时间序列很有用) pct_change...: groups['C'].count()##按照A列的分组B组计数 Out[210]: A bar 3 foo 5 Name: C, dtype: int64 2、Apply 函数 向数据框的每一行或每一列传递指定函数后...最后的ignore_index不能忘记,因为python里面对索引的要求很高,所以重叠的索引会删除重复的内容。...来源: Python对多属性的重复数据去 >>> import pandas as pd >>> data={'state':[1,1,2,2],'pop':['a','b','c','d']}

4.7K40

精选100个Pandas函数

assign() 字段衍生 b bfill() # 后向填充;使用缺失后一个填充缺失 between() 区间判断 c count() # 计数(不包含缺失) cov() 计算协方差...corr() # 计算相关系数 cumsum() 累计 cumprod() 累计积 compress 条件判断 concat() # 数据合并 d dtypes() 查看数据字段类型...hasnans() 判断元素是否存在缺失;返回的是True或者False i isnull() # 判断序列元素是否为缺失,返回bool isin() 成员判断 iloc() #...最大的前n个 p pct_change 运算比率;后一个前一个的比例 pd.to_datetime() 转日期时间类型 pd.Series() # 创建Series数据 pd.DataFrame...抽样 str.split() 字符分割 str.findall() sort_values() # 排序 sort_index() 索引排序 stack() # 堆叠;列转行 t to_dict

21530

Python】基于某些列删除数据框的重复

默认False,即把原数据copy一份,copy数据上删除重复,并返回数据框(原数据框不改变)。为True时直接在原数据视图上删,没有返回。...从结果知,参数为默认时,是原数据的copy上删除数据,保留重复数据第一条并返回数据框。 感兴趣的可以打印name数据框,删操作不影响name的。...从结果知,参数keep=False,是把原数据copy一份,copy数据框删除全部重复数据,并返回数据框,不影响原始数据框name。...原始数据只有第二行最后一行存在重复,默认保留第一条,故删除最后一条得到数据框。 想要根据更多列数去,可以subset添加列。...但是对于两列中元素顺序相反的数据框去,drop_duplicates函数无能为力。 如需处理这种类型的数据去问题,参见本公众号的文章【Python】基于多列组合删除数据框的重复。 -end-

18.1K31

RFM模型是什么?我用Tableau告诉你

度量维度的介绍可以参考下面链接: https://help.tableau.com/current/pro/desktop/zh-cn/datafields_typesandroles.htm 可以原数据的基础上...Step1:数据预处理 这一环节主要是对数据格式进行处理,并添加的数据列便于后续使用。本文数据使用tableau自带数据“示例-超市”,数据是客户超市购物的清单,每件商品一条记录。...查看【F客户累计单数】分布,先创建【F客户累计单数(数据桶)】(如图所示,桶的步长可以按照需要设定,此处设定为1),以【F客户累计单数(数据桶)】为X轴,【F客户累计单数】-计数 为Y轴,可获取【F客户累计单数...轴,用【客户 Id】-计数(不同)作为Y轴,选择快速表计算-总额百分比。...【标记】部分复制【客户 Id】-计数(不同)到【标签】(mac端操作为:鼠标选中同时command或者control键),可以柱状图上显示出其人群的占比。 ?

3.3K10

利用Python统计连续登录N天或以上用户

在有些时候,我们需要统计连续登录N天或以上用户,这里采用python通过分组排序、分组计数等步骤实现该功能,具体如下: 导入需要的库 import pandas as pd import numpy as...采取drop_duplicate方案即可保留删除重复数据只保留一条 df.drop_duplicates(inplace=True) #因为玩家某一天存在登录多次情况,这里可以用去过滤掉多余数据...第四步,计算差值 这一步是辅助操作,使用第三步的辅助列与用户登录日期做差值得到一个日期,若某用户某几列该相同,则代表这几天属于连续登录 因为辅助列是float型,我们在做时间差的时候需要用到to_timedelta...().reset_index() #根据用户id上一步计算的差值 进行分组计数 ?...(是一个日期) data = df.groupby(['role_id','date_sub']).count().reset_index() #根据用户id上一步计算的差值 进行分组计数 data

3.2K30

Python数据分析笔记——Numpy、Pandas库

Pandas基本功能 1、重新索引 Pandas对象的一个方法就是重新索引(reindex),其作用是创建一个的索引,pandas对象将这个索引进行排序。对于不存在的索引,引入缺失。...(1)Series数据结构的排序排名 a、索引进行排序 b、进行排序 默认情况下,排序是升序排列的,但也可通过ascending=False进行降序排列。...obj.rank() (2)DataFrame数据结构的排序排名 索引进行排列,一列或多列进行排序,通过by将列名传递给sort_index. 5、缺失数据处理 (1)滤出缺失数据 使用data.dropna...(列从0开始计数) 6、汇总和计算描述统计 就是针对数组进行常用的数学统计运算。大部分都属于约简汇总统计。 其中有求和(sum)运算、累计(cumsum)运算、平均值(mean)等运算。...7、唯一的获取 此方法可以用于显示去后的数据。 8、计数 用于计算一个Series出现的次数。

6.4K80

Python入门(13)

编写九九乘法口诀表 寻找一个符合条件的整数 实现无重复数字的排列组合 根据销售额计算奖金 编写一个python语法的冒泡排序法 根据一组数据实现任意列排序 6个案例,有3个数学问题,有3个程序算法问题...3、第三行,第二个循环语句定义了1-9的j。 4、第四行,用格式化(占位符)的方法,定义一个独立算式计算结果的字符串x。 5、运用字符串的“加法”,将x累计拼接到y。...2、定义i变量,0-100000取值。 3、第4、5行开方并取整后赋值给x、y。 4、第6行,条件判断。 5、如果条件成立,则终止循环(试错),输出(显示)当前i。...(集合可以帮我们去) 2、分别创建4个for循环,定义了4个变量i、j、k、m,它们都能从1-4取值,分别代表4位数的一个数。...4、全部获得每一轮取值后,再添加到myset中去。 5、最后,全部迭代完毕,获取到的最终myset就是我们想要的结果。读取显示一个集合的数据同样适用for循环迭代的方法。

60720

Python入门第六讲】贴近生活数据类型 | 数字

数字 (Number) 是 Python 基本的数据类型之一,数字类型属于数值型数据,用于存储数值,是不可改变的,数值发生改变时,会重新分配内存空间,产生的对象。...浮点型(Float) :浮点型由整数部分与小数部分组成,浮点型也可以使用科学计数法表示(1.8e2 = 1.8 x 10^2 = 180)复数( (Complex)) :复数由实数部分虚数部分构成,可以用...浮点数用于表示带有小数部分的数值,包括正数、负数零。计算,浮点数可以进行更精确的数学运算,但也需要注意浮点数运算可能产生的精度问题。定义复数的方式:1....复数在数学工程领域中有广泛的应用,例如在信号处理控制系统。布尔 Python ,布尔 True False 分别对应数字 1 0。...Python 中进行日期时间格式转换的基本工具。

17311

Python批量处理Excel数据后,导入SQL Server

2.6 完整调用代码 1、前言 紧接昨天的文章Windows下载安装配置SQL Server、SSMS,使用Python连接读写数据,我们已经安装配置好了sqlserver,也成功测试了如何利用Python...eg. 06/Jan/2022 12:27 --> 2022-1-6 主要涉及:日期格式处理、数据去处理 2) 每一个Excel都对应一个不同数据表吗?表名Excel附件名称是否一致?...代码如下,首先将字符串格式转变成日期类型数据,原数据为06/Jan/2022 12:27(数字日/英文月/数字年 数字小时:数字分钟),日期格式化符号解释表对应关系替换即可。...return common_date 日期格式化符号解释表 @CSDN-划船的使者 “3)订单编号SOID去 ” 这里去重复除了指定列去外,还需要按日期保留最新数据。...我的想法是,首先调用pandas的sort_values函数将所有数据根据日期列进行升序排序,然后,调用drop_duplicates函数指定SOID列进行去,并指定keep为last,表示重复数据中保留最后一行数据

4.5K30

Python数据结构详解(一)

由于Python是动态编程语言,所以定义变量时并不需要事先指定变量的数据类型,变量的声明初始化是同时进行的。...1.1.3 数字中支持下划线 Python 3.6引入的特性,数字中支持使用下划线,方便阅读,字符串format方法也支持了 ‘_’ 选项,当格式化为浮点数或整数时,以3位分隔,当格式化为 ’b’...哈哈,说吧,是不是大学数学没有好好学~ 1.3.2 复数类型表达方式 复数由“实部”“虚部”两部分组成,实数部分虚数部分都是浮点型,Python中表示复数的两种方法: a+bj,注意虚数部分需要加上...) # 获取复数的共轭复数 print(a.conjugate()) 1.4 布尔类型 1.4.1 布尔类型表达方式 Python布尔类型只有TrueFalse两个取值,可以将这两个翻译为”...1.4.2 布尔类型转换 Python,每种类型都可以被解释为布尔类型,例如:None,0,”“,[],(),{} 被解释为False;非零数值,非空字符串被解释为True print(bool(None

869100

教你用Python画出全球疫情动态图

Show me data,用数据说话 今天我们用Python绘制 全球疫情动态图 点击下方视频,先睹为快:https://v.qq.com/x/page/q0959nn32lc.html 目前,全球冠疫情还十分严峻...其中,全球累计确诊近296万例,累计死亡超20万例;美国累计确诊超100万例,西班牙意大利累计确诊均超过20万例。...01 全球疫情严峻 美国确诊超100万 根据世卫组织最新实时统计数据,截至欧洲中部时间28日10时(北京时间28日16时),全球范围内,冠确诊病例较前一日增加76026例,达到2954222例;死亡病例较前一日增加...美国约翰斯·霍普金斯大学统计数据显示,美国东部时间28日14时50分(北京时间29日2时50分)的数据显示,美国冠确诊病例升至1002498例,死亡病例为57533例,确诊病例死亡病例数都是全球最多...)、国家(countriesAndTerritories)、日新增确诊(cases)三列即可 通过日新增确诊人数计算每日累计确诊人数 对日期列进行摊平,按照国家和日期进行数据透视操作。

1.5K30
领券