首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Pandas常用命令汇总,建议收藏!

凭借其广泛功能,Pandas 对于数据清理、预处理、整理和探索性数据分析等活动具有很大价值。 Pandas核心数据结构是Series和DataFrame。...# 用于显示数据前n df.head(n) # 用于显示数据后n df.tail(n) # 用于获取数据行数和列数 df.shape # 用于获取数据索引、数据类型和内存信息 df.info...# 检查重复 df.duplicated() # 删除重复 df.drop_duplicates() # 计算z分数 z_scores = (df - df.mean()) / df.std...# 将df中添加到df2末尾 df.append(df2) # 将df中添加到df2末尾 pd.concat([df, df2]) # 对列A执行连接 outer_join = pd.merge...# 以csv格式导出, 不带索引导出 df.to_csv('filename.csv', index=False) # 以Excel格式导出, 不带索引导出 data.to_excel('filename.xlsx

36210

数据导入与预处理-课程总结-04~06章

2.1.2 删除缺失值 pandas中提供了删除缺失值方法dropna(),dropna()方法用于删除缺失值所在或一列数据,并返回一个删除缺失值后对象。...inplace:表示是否放弃副本数据,返回数据,默认为False。 ignore_index:表示是否对删除重复值后对象索引重新排序,默认为Flase。...how参数取值‘inner’代表基于left与right共有的键合并,类似于数据库连接操作;'left’代表基于left键合并,类似于数据库连接操作;'right’代表基于right键合并...,类似于数据库连接操作;'outer’代表基于所有left与right键合并,类似于数据库连接操作。...’inner’或’outer’(默认值),其中’inner’表示内连接,即合并结果为多个对象重叠部分索引及数据,没有数据位置填充为NaN;'outer’表示连接,即合并结果为多个对象各自索引及数据

13K10

Python数据分析之数据预处理(数据清洗、数据合并、数据重塑、数据转换)学习笔记

keep:删除重复并保留第一次出现取值可以为 first、last或 False  ​ duplicated()方法用于标记 Pandas对象数据是否重复重复则标记为True,不重复则标记为False...axis:表示连接轴向,可以为0或1,默认为0 join:表示连接方式,inner表示内连接, outer表示连接默认使用连接。...2.2.1.1 how参数可以取下列值  left:使用左侧 DataFrame键,类似SQL连接 right:使用右侧 DataFrame键,类似SQL连接 outer:使用两个...3.2.1 pivot()方法  index:用于创建 DataFrame对象索引。...4.1.1 rename()方法  index,columns:表示对索引名或列索引名转换。  inplace:默认为False,表示是否返回Pandas对象。

5.1K00

Pandas 学习手册中文第二版:1~5

具体而言,在本章中,我们将介绍: 重命名列 使用[]和.insert()添加列 通过扩展添加列 使用连接添加列 重新排序列 替换列内容 删除列 添加 连接 通过扩展添加和替换行 使用.drop...然后,pandasSeries与副本DataFrame对齐,并将其添加为名为RoundedPrice列。 列将添加到列索引末尾。 .insert()方法可用于在特定位置添加列。...连接可能会导致重复列名。 为了演示这种情况,让我们重新创建rounded_price,但将其命名为Price列。.../-/raw/master/docs/learning-pandas-2e/img/00201.jpeg)] 现在,连接将导致重复列。...附加过程将返回一个DataFrame,并首先添加来自原始DataFrame数据,然后再添加第二数据。 追加不会执行对齐,并且可能导致索引标签重复

8.1K10

数据专家最常使用 10 大类 Pandas 函数 ⛵

图片 5.处理重复我们手上数据集很可能存在重复记录,某些数据意外两次输入到数据源中,清洗数据时删除重复很重要。...以下函数很常用:duplicated: 识别DataFrame中是否有重复,可以指定使用哪些列来标识重复。drop_duplicates:从 DataFrame 中删除重复。...一般建议大家先使用 duplicated检查重复,确定业务上需要删除重复,再使用这个函数。图片 6.处理缺失值现实数据集中基本都会存在缺失值情况,下面这些函数常被用作检查和处理缺失值。...,在创建列时经常需要指定 axis=1。...重要参数包括 on(连接字段),how(例如内连接或左连接,或连接),以及 suffixes(相同字段合并后后缀)。concat:沿行或列拼接DataFrame对象。

3.5K21

Pandas 学习手册中文第二版:11~15

然后,具有NaN值,其中源对象中不存在列。 指定连接类型 默认连接实际上沿着与连接相反轴(索引)上索引标签执行连接操作。 这使得标签结果集类似于执行那些标签并集。.../apachecn/apachecn-ds-zh/-/raw/master/docs/learning-pandas-2e/img/00535.jpeg)] 与在axis=1上进行连接连接一样,在不考虑创建重复情况下复制索引标签...忽略索引标签 如果要确保结果索引没有重复并保留所有,则可以使用ignore_index=True参数。...然后,它为每组匹配标签在结果​​中创建一。 然后,它将来自每个源对象那些匹配数据复制到结果相应和列中。 它将Int64Index分配给结果。 合并中连接可以使用多个列中值。...此外,采用这种格式更容易添加变量和度量,因为可以简单地将数据添加,而不需要通过添加列来更改DataFrame结构。 堆叠数据性能优势 最后,我们将研究为什么要堆叠数据。

3.3K20

数据分析之Pandas合并操作总结

highlight=update#pandas.DataFrame.update concat方法 concat方法可以在两个维度上拼接,默认纵向凭借(axis=0),拼接方式默认连接 所谓连接,就是取拼接方向并集...highlight=concat#pandas.concat merge与join 1. merge函数 merge函数作用是将两个pandas对象横向合并,遇到重复索引时会使用笛卡尔积,默认inner...默认使用inner连接,因为merge只能横向拼接,所以取向上keys交集,下面看如果使用how=outer参数。...highlight=merge#pandas.DataFrame.merge 2. join函数 join函数作用是将多个pandas对象横向拼接,遇到重复索引时会使用笛卡尔积,默认左连接,可选inner...(b) 将所有不符合(a)中条件筛选出来,合并为一张表,列名与原表一致。

4.7K31

Pandas 学习手册中文第二版:6~10

NaN值标签为1,是 十分之一,因此插值将为0 + (100 - 0) / 10或10。 处理重复数据 样本中数据通常可以包含重复。...请注意,删除重复时会保留索引。 重复记录可能具有不同索引标签(在计算重复时不考虑标签)。 因此,保留行会影响结果DataFrame对象中标签集。 默认操作是保留重复第一。...如果要 保留重复最后一,请使用keep='last'参数。...-2e/img/00510.jpeg)] 常见做法是获取应用操作结果并将其添加为DataFrame列。...因此,在 Pandas 中,最好只添加或列(或全新对象),并且如果以后内存或性能成为问题,请根据需要进行优化。

2.2K20

数据导入与预处理-第6章-01数据集成

常用合并数据函数包括: 2.1 主键合并数据merge 主键合并数据类似于关系型数据库连接操作,主要通过指定一个或多个键将两组数据进行连接,通常以两组数据中重复列索引为合并键。...,类似于数据库连接操作;'outer’代表基于所有left与right键合并,类似于数据库连接操作。...result = pd.merge(df_left, df_right, on='key') result 输出为: 左连接方式合并数据 # 以key为主键,采用左连接方式合并数据...若设为True,则会在清除结果对象现有索引后生成一组索引。...; pd.concat()通过axis参数指定在水平还是垂直方向拼接; df.append()在DataFrame末尾添加或多行;大致等价于pd.concat([df1,df2],axis=0

2.5K20

掌握这些 NumPy & Pandas 方法,快速提升数据处理效率!

Pandas 是基于NumPy 一种工具,该工具是为解决数据分析任务而创建pandas 纳入了大量库和一些标准数据模型,提供了高效地操作大型数据集所需工具。... array([1, 2]) >>> b[0:2,1] # 选择第1列中第0和第1项目 array([ 2., 5.]) >>> b[:1] # 选择第0所有项目,等价于b[0:1...>>> h.resize((2,6)) # 返回一个具有形状(2,6)数组 >>> np.append(h,g) # 向数组添加 >>> np.insert(a, 1, 5) #...在数组中插入 >>> np.delete(a,[1]) # 从数组中删除 合并数组 >>> np.concatenate((a,d),axis=0)# 连接数组 array([ 1, 2, 3...其中参数意义与merge方法基本相同,只是join方法默认为左连接how=left。

4.9K20

掌握这些 NumPy & Pandas 方法,快速提升数据处理效率

Pandas 是基于NumPy 一种工具,该工具是为解决数据分析任务而创建pandas 纳入了大量库和一些标准数据模型,提供了高效地操作大型数据集所需工具。... array([1, 2]) >>> b[0:2,1] # 选择第1列中第0和第1项目 array([ 2., 5.]) >>> b[:1] # 选择第0所有项目,等价于b[0:1...>>> h.resize((2,6)) # 返回一个具有形状(2,6)数组 >>> np.append(h,g) # 向数组添加 >>> np.insert(a, 1, 5) #...在数组中插入 >>> np.delete(a,[1]) # 从数组中删除 合并数组 >>> np.concatenate((a,d),axis=0)# 连接数组 array([ 1, 2, 3...其中参数意义与merge方法基本相同,只是join方法默认为左连接how=left。

3.7K20

Pandas_Study02

,how 原理同上 # 同时可以添加条件删除 print(df.dropna(axis = 1, thresh = 2)) # axis=1按列操作,thresh 指示这一列或中有两个或以上非NaN...实际上就是对两个df 求交集还是并集选择 # 连接就是并集,内连接就是交集 3. merge() 方法 merge函数可以真正实现数据库内外连接,且连接还可以有左右连接特性。...连接,分左连接,右连接,全连接,左连接是左表上所有匹配右表,正常能匹配上取B表值,不能取空值,右连接同理,全连接则是取左并上右表所有,没能匹配上用空值填充。...course)) merge可以进行左连接,右连接,全连接。...表得出结果 print(choose.merge(course, how = "outer")) # merge进行左右连接 # course表左连接choose表,结果保留course 全部及列

18110

一句Python,一句R︱数据合并、分组、排序、翻转、集合

1、objs 就是需要连接对象集合,一般是列表或字典; 2、axis=0 是连接轴向join='outer' 参数作用于当另一条轴 index 不重叠时候,只有 'inner' 和 'outer...3、pandasDataFrame pandas中有sort和rank,这个就跟R里面是一样了。...# 对称差集(在t或s中,但不会同时出现在二者中) 基本操作: t.add('x') # 添加 s.update([10,37,42]) # 在s中添加多项...t) s & t 返回一个 set 包含 s 和 t 中公共元素 s.difference(t) s - t 返回一个 set 包含 s 中有但是 t 中没有的元素...s.symmetric_difference(t) s ^ t 返回一个 set 包含 s 和 t 中不重复元素 s.copy() 返回 set “s”一个浅复制

1.2K20

SQL查询高级应用

=email FROM testtable 4.删除重复 SELECT语句中使用ALL或DISTINCT选项来显示表中符合条件所有或删除其中重复数据,默认为ALL。...使用DISTINCT选项时,对于所有重复数据行在SELECT返回结果集合中只保留一。...连接操作给用户带来很大灵活性,他们可以在任何时候增加数据类型。为不同实体创建表,尔后通过连接进行查询。   ...与内连接不同是,连接不只列出与连接条件相匹配,而是列出左表(左连接时)、右表(右连接时)或两个表(全连接时)中所有符合搜索条件数据。...而采用连接时,它返回到查询结果集合中不仅包含符合连接条件,而且还包括左表(左连接时)、右表(右连接时)或两个边接表(全连接)中所有数据

2.9K30

Python连接大法|“合体”

对象中,如果位指定,则以left和right列名交集作为连接键 left_on 以左侧DataFrame作为连接键 right_on 以右侧DataFrame作为连接键 left_index 以左侧索引作为连接键...right_index 以右侧索引作为连接键 sort 根据连接键对合并后数据进行排序,默认为True suffixes 字符串值元组,用于追加到重叠列名末尾,默认为('x','y') copy...,对象必须是pandas数据类型 axis 按列或者拼接,0是纵轴,1是横轴 join 制定inner或outer,默认为outer keys 默认无,如果传递了多个级别,则应包含元组。...levels 序列列表,默认无,用于构造多重索引 names 创建分层级别的名称 verify_integrity bool,默认为False,检查连接轴是否包含重复 一向公正pandas社长同样也为小超建造了一个场景...伸个懒腰,小结一下吧: 1.merge默认是内连接,concat默认是连接 2.concat准确来说是拼接,axis参数决定横纵向拼接,在axis=1 时为横向拼接,等价于merge 3.merge合并范围广泛

75510

超硬核 Python 数据可视化教程!

下面是一些常用数据转换方法: 合并:merge,concat,combine_frist(类似于数据库中连接) 重塑:reshape;轴向旋转:pivot(类似excel数据透视表) 去重:drop_duplicates...添加图例 图例legend是另一种用于标识图标元素重要工具。可以在添加subplot时候传入label参数。...注解 除标准图表对象之外,我们还可以自定义添加一些文字注解或者箭头。 注解可以通过text,arrow和annotate等函数进行添加。...组装一张图表需要单独调用各个基础组件才Pandas中有许多基于matplotlib高级绘图方法,原本需要多行代码才能搞定图表,使用pandas只需要短短几行。...:在Y轴上使用对数标尺 DataFrame.plot方法参数 DataFrame除了Series中参数,还有一些独有的选项。

4.9K51

Pandas 秘籍:6~11

索引支持重复值,并且如果在任何索引中碰巧有重复,则哈希表将无法再用于其实现,并且对象访问会变得很慢。...现在,当我们尝试创建列时,将引发一个错误,警告我们有重复。...在第 4 步中,我们创建三个表,并在每个表中保留id列。 我们还保留num列以标识确切director/actor列。 步骤 5 通过删除重复和缺失值来压缩每个表。...为了帮助弄清它们之间差异,请查看以下概述: concat: Pandas 函数 垂直或水平组合两个或多个 Pandas 对象 仅在索引上对齐 每当索引中出现重复时发生错误 默认为连接,带有内连接选项...join: 数据帧方法 水平组合两个或多个 Pandas 对象 将调用数据帧列或索引与其他对象索引(而不是列)对齐 通过执行笛卡尔积来处理连接列/索引上重复值 默认为左连接,带有内,和右选项

33.8K10

Pandas Cookbook》第09章 合并Pandas对象

# concat函数默认使用连接,会保留每个DataFrame中所有。...4. concat, join, 和merge区别 concat: Pandas函数 可以垂直和水平地连接两个或多个pandas对象 只用索引对齐 索引出现重复值时会报错 默认是连接(也可以设为内连接...) join: DataFrame方法 只能水平连接两个或多个pandas对象 对齐是靠被调用DataFrame列索引或索引和另一个对象索引(不能是列索引) 通过笛卡尔积处理重复索引值 默认是左连接...(也可以设为内连接连接和右连接) merge: DataFrame方法 只能水平连接两个DataFrame对象 对齐是靠被调用DataFrame列或索引和另一个DataFrame列或索引...通过笛卡尔积处理重复索引值 默认是内连接(也可以设为左连接连接、右连接) # 用户自定义display_frames函数,可以接收一列DataFrame,然后在一中显示: In[91]: from

1.9K10
领券