首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas常用命令汇总,建议收藏!

它提供了高效数据结构和功能,使用户能够有效地操作和分析结构化数据。 凭借其广泛功能,Pandas 对于数据清理、预处理、整理和探索性数据分析等活动具有很大价值。...Pandas核心数据结构是Series和DataFrame。 Series是一个一维标记数组,可以容纳多种数据类型。DataFrame则是一种二维表状结构,由组成,类似于电子表格或SQL表。...# 检查缺失 df.isnull() # 删除有缺失 df.dropna() # 用特定填充缺失 df.fillna(value) # 插入缺失 df.interpolate()...# df中添加到df2末尾 df.append(df2) # df中添加到df2末尾 pd.concat([df, df2]) # 对A执行外连接 outer_join = pd.merge...# 计算某最大 df['column_name'].max() # 计算某中非空数量 df['column_name'].count() # 计算中某个出现次数 df['column_name

36310

如何使用Excel某几列有标题显示到新

如果我们有好几列有内容,而我们希望在新中将有内容标题显示出来,那么我们怎么做呢? Excel - TEXTJOIN function 1....- - - - 4 - - - 在开始,我们曾经使用INDEX + MATCH方式,但是没有成功,一直是N/A https://superuser.com/questions/1300246/if-cell-contains-value-then-column-header...所以我们后来改为TEXTJOIN函数,他可以显示,也可以显示标题,还可以多个列有时候同时显示。...- - 4 - - - 15 Year 5 - - - - 5 - - - =TEXTJOIN(", ",TRUE,IF(ISNUMBER(B2:I2),$B$1:$I$1,"")) 如果是想要显示,...则: =TEXTJOIN(", ",TRUE,IF(ISNUMBER(B2:I2),B2:I2,"")) 其中,ISNUMBER(B2:I2)是判断是不是数字,可以根据情况改成是不是空白ISBLANK

11.3K40
您找到你想要的搜索结果了吗?
是的
没有找到

妈妈再也不用担心我忘记pandas操作了

(np.random.rand(20,5)) # 创建205随机数组成DataFrame对象 pd.Series(my_list) # 从可迭代对象my_list创建一个Series对象 df.index...s.value_counts(dropna=False) # 查看Series对象唯一和计数 df.apply(pd.Series.value_counts) # 查看DataFrame对象中每一唯一和计数...() # 返回每一最小 df.median() # 返回每一中位数 df.std() # 返回每一标准差 数据合并: df1.append(df2) # df2中添加到df1尾部...df.concat([df1, df2],axis=1) # df2中添加到df1尾部 df1.join(df2,on=col1,how='inner') # 对df1和df2执行SQL...(np.mean) # 对DataFrame每一应用函数np.mean data.apply(np.max,axis=1) # 对DataFrame每一应用函数np.max 其它操作: 改列名

2.2K31

精心整理 | 非常全面的Pandas入门教程

dataframe是一种二维数据结构,数据以表格形式(与excel类似)存储,有对应dataframe结构名称: ? 4. series教程 1....如何改变导入csv文件 改变列名‘medv’,当≤25时,赋值为‘Low’;>25时,赋值为‘High’. # 使用converters参数,改变medv df = pd.read_csv...如何改变dataframe顺序 df = pd.DataFrame(np.arange(20).reshape(-1, 5), columns=list('abcde')) print(df)...如何dataframe所有以百分数格式表示 df = pd.DataFrame(np.random.random(4), columns=['random']) # 格式化为小数点后两位百分数...如何创建包含每行第二大 df = pd.DataFrame(np.random.randint(1,100, 9).reshape(3, -1)) print(df) # 方向上取第二大组成

9.9K53

Pandas系列 - DataFrame操作

切片 附加行 append 删除 drop 数据帧(DataFrame)是二维数据结构,即数据以表格方式排列 数据帧(DataFrame)功能特点: 潜在是不同类型 大小可变 标记轴...() 可以对执行算术运算 pandas.DataFrame 构造函数: pandas.DataFrame(data, index, columns, dtype, copy) 编号 参数...2 index 对于标签,要用于结果帧索引是可选缺省np.arrange(n),如果没有传递索引。 3 columns 对于标签,可选默认语法是 - np.arange(n)。...这只有在没有索引传递情况下才是这样。 4 dtype 每数据类型。 5 copy 如果默认为False,则此命令(或任何它)用于复制数据。...附加行 append 使用append()函数添加到DataFrame import pandas as pd df = pd.DataFrame([[1, 2], [3, 4]], columns

3.8K10

创建DataFrame:10种方式任你选!

微信公众号:尤而小屋 作者:Peter 编辑:Peter DataFrame数据创建 在上一篇文章中已经介绍过pandas中两种重要类型数据结构:Series类型和DataFrame类型,以及详细讲解了如何创建...['A','B','C'], # 指定属性 index=[0,1,2] # 指定索引 ) df0 [008i3skNgy1gqfh54td30j30ei076mxa.jpg] 改变数据索引....jpg] 手动创建DataFrame 每个字段数据通过列表形式列出来 df1 = pd.DataFrame({ "name":["小明","小红","小侯","小周","小孙"],....jpg] 使用Series数据创建 DataFrame数个 Series 按合并而成二维数据结构,每一单独取出来是一个 Series ,所以我们可以直接通过Series数据进行创建。...)是pandas中二维数据结构,即数据以表格方式排列,类似于 Excel 、SQL 表,或 Series 对象构成字典。

4.5K30

Numpy和pandas使用技巧

可以在创建数组时候np.array(ndmin=)设置最小维度 ndarray.shape 数组维度,对于矩阵,nm,不改变原序列 ndarray.size 数组元素总个数...,相当于shape中n*m改变原序列 ndarray.itemsize,数组每个元素大小,以字节为单位 ndarray.dtype 数组元素类型 ndarray.nbytes...表示) 指定轴最大np.max(参数1: 数组; 参数2: axis=0/1,0表示1表示) 指定轴最小np.min(参数1: 数组; 参数2: axis=0/1,0表示1表示...) 最大索引np.argmax(参数1: 数组; 参数2: axis=0/1,0表示1表示) 最小索引np.argmin(参数1: 数组; 参数2: axis=0/1,0...:] 一 a.iloc[:,1] a["feature_1"] 合并dataframe 横向 pd.concat([a,a],axis=1) 纵向 pd.concat([a,a],axis=0) 数据去重

3.5K30

(六)Python:Pandas中DataFrame

目录 基本特征 创建 自动生成行索引 自定义生成行索引 使用 索引与 基本操作 统计功能  ---- 基本特征 一个表格型数据结构 含有一组有序(类似于index) 大致可看成共享同一个index...                我们可以通过一些基本方法来查看DataFrame索引、索引和,代码如下所示: import pandas as pd import numpy as np data...: pay, dtype: object 取得第一和第二第一 2    5000 3    6000 Name: pay, dtype: object 取得第零和第一第零 1...'pay': 5000, 'tax': 0.05} print(aDF) print("===============================") aDF['tax'] = 0.03 # 修改为相同...xiaohong  5000  0.05 3   xiaolan  6000  0.10 5     Liuxi  5000  0.05 =============================== 修改为相同

3.8K20

如何在Python 3中安装pandas包和使用数据结构

没有声明索引 我们输入整数数据,然后为Series提供name参数,但我们避免使用index参数来查看pandas如何隐式填充它: s = pd.Series([0, 1, 4, 9, 16, 25...], name='Squares') 现在,让我们打电话给系列,这样我们就可以看到pandas作用: s 我们看到以下输出,左索引,右数据。...下方是有关系列名称和组成数据类型信息。...DataFrames DataFrame是二维标记数据结构,其具有可由不同数据类型组成DataFrame类似于电子表格或SQL表。...删除或注释掉我们添加到文件中最后两,并添加以下内容: ... df_fill = df.fillna(0) ​ print(df_fill) 当我们运行程序时,我们收到以下输出: first_name

18.2K00

十分钟入门 Pandas

numpy数组,标签可以是数字或字符; 关键点 均匀数据; 尺寸大小不变; 数据可变; Dataframe 定义 二维、表格型数组结构,可存储许多不同类型数据,且每个轴都有标签,可当作一个...series字典; 关键点 异构数据; 大小可变; 数据可变; 功能特点 潜在类是不同类型; 大小可变; 标记轴(); 可对执行算术运算; Panel 定义 三维,大小可变数组...; 关键点 异构数据; 大小可变; 数据可变; 三者区别与共性 可变性:三者都是可变,除了series都是大小可变; 较高维数据结构是较低维数据结构容器,Panel 是 DataFrame...容器,DataFrame是 Series 容器; 如何使用Pandas #!...(),为DataFrame每一返回一个产生一个命名元祖迭代器,元祖第一个元素将是相应索引,剩余 print('itertuples:') for row in dataFrame.itertuples

3.7K30

Pandas最详细教程来了!

惯例是pandas简写为pd,命令如下: import pandas as pd Pandas包含两个主要数据结构:Series和DataFrame。...每都可以是不同数据类型(数值、字符串、布尔等)。 DataFrame既有索引也有索引,这两种索引在DataFrame实现上,本质上是一样。...但在使用时候,往往是索引作为区分不同数据标签。DataFrame数据结构与SQL数据表或者Excel工作表结构非常类似,可以很方便地互相转换。...由图3-23可以看到,大于0数据都能显示,其他数据显示为NaN。 df[df>0] 运行结果如图3-23所示。 ? ▲图3-23 再来看一下如何改变df。...▲图3-24 使用loc改变,代码如下: df.loc[:,'E']=1 df 运行结果如图3-25所示。 ?

3.2K11

十分钟入门Pandas

numpy数组,标签可以是数字或字符; 关键点 均匀数据; 尺寸大小不变; 数据可变; Dataframe 定义 二维、表格型数组结构,可存储许多不同类型数据,且每个轴都有标签,可当作一个series...字典; 关键点 异构数据; 大小可变; 数据可变; 功能特点 潜在类是不同类型; 大小可变; 标记轴(); 可对执行算术运算; Panel 定义 三维,大小可变数组; 关键点...异构数据; 大小可变; 数据可变; 三者区别与共性 可变性:三者都是可变,除了series都是大小可变; 较高维数据结构是较低维数据结构容器,Panel是DataFrame容器,DataFrame...是Series容器; 如何使用Pandas #!...(),为DataFrame每一返回一个产生一个命名元祖迭代器,元祖第一个元素将是相应索引,剩余 print('itertuples:') for row in dataFrame.itertuples

4K30

Pandas缺失数据处理

函数可以接收一个自定义函数, 可以DataFrame/数据传递给自定义函数处理 apply函数类似于编写一个for循环, 遍历/每一个元素,但比使用for循环效率高很多         import..., 直接应用到整个DataFrame中: 使用apply时候,可以通过axis参数指定按/ 按 传入数据 axis = 0 (默认) 按处理 axis = 1 按处理,上面是按都执行了函数.../3 df.apply(avg_3_apply) 按一执行结果:(一共两,所以显示两结果) 创建一个新'new_column',其为'column1'中每个元素两倍,当原来元素大于...10时候,里面的赋0: import pandas as pd data = {'column1':[1, 2, 15, 4, 8]} df = pd.DataFrame(data) df[...# 可以翻译为:df['new_column']=0 或 row['new_column'] 请创建一个两DataFrame数据,自定义一个lambda函数用来两之和,并将最终结果添加到'

9510

Pandas速查手册中文版

(np.random.rand(20,5)):创建205随机数组成DataFrame对象 pd.Series(my_list):从可迭代对象my_list创建一个Series对象 df.index...s.value_counts(dropna=False):查看Series对象唯一和计数 df.apply(pd.Series.value_counts):查看DataFrame对象中每一唯一和计数...():检查DataFrame对象中,并返回一个Boolean数组 pd.notnull():检查DataFrame对象中非空,并返回一个Boolean数组 df.dropna():删除所有包含空...df.dropna(axis=1):删除所有包含空 df.dropna(axis=1,thresh=n):删除所有小于n个非空 df.fillna(x):用x替换DataFrame对象中所有的空...中每一应用函数np.max 数据合并 df1.append(df2):df2中添加到df1尾部 df.concat([df1, df2],axis=1):df2中添加到df1尾部 df1

12.1K92

盘一盘 Python 系列 4 - Pandas (下)

先把 df1 和 df2 标签补齐 再把 df1 和 df2 纵向连起来 pd.concat( [df1, df2] ) 得到 DataFrame index = [0,1,2,0,1],有重复...而重塑就是通过改变数据表里面的「索引」和「索引」来改变展示形式。...透视表是用来汇总其它表数据: 首先把源表分组,将不同值当做 (row)、 (column) 和 (value) 然后对各组内数据做汇总操作如排序、平均、累加、计数等 这种动态·「源表」得到想要...【重塑数据表】用 stack 函数索引」变成「索引」,用 unstack 函数索引」变成「索引」。它们只是改变数据表布局和展示方式而已。...---- 【透视数据表】用 pivot 函数「一张长表」变成「多张宽表」,用 melt 函数「多张宽表」变成「一张长表」。它们只是改变数据表布局和展示方式而已。

4.7K40

猿创征文|数据导入与预处理-第3章-pandas基础

1.4.1 Dataframe简介 DataFrame是一个结构类似于二维数组或表格对象,与Series类对象相比,DataFrame类对象也由索引和数据组成,但该对象有两组索引,分别是索引和索引...DataFrame类对象索引位于最左侧一索引位于最上面一,且每个索引对应着一数据。DataFrame类对象其实可以视为若干个公用索引Series类对象组合。...如下所示: "二维数组"Dataframe:是一个表格型数据结构,包含一组有序,其类型可以是数值、字符串、布尔等。...,如出现新为NaN # index在这里和之前不同,并不能改变原有index,如果指向新标签,为NaN (非常重要!)...(标签)对齐 输出为: /排序 排序1 - 按排序 .sort_values pandas中可以使用sort_values()方法Series、DataFrmae类对象按大小排序。

13.9K20

【Python环境】Python中结构化数据分析利器-Pandas简介

因此对于DataFrame来说,每一数据结构都是相同,而不同之间则可以是不同数据结构。...创建DataFrame有多种方式: 以字典字典或Series字典结构构建DataFrame,这时候最外面字典对应DataFrame,内嵌字典及Series则是其中每个。...由d构建为一个42DataFrame。其中one只有3个,因此done列为NaN(Not a Number)--Pandas默认缺失标记。...(df, values = 'D', rows = ['A', 'B'], cols = ['C'])#以A、B为标签,以C为标签D汇总求和pd.crosstab(rows = ['A',...'B'], cols = ['C'], values = 'D')#以A、B为标签,以C为标签D汇总求和 时间序列分析 时间序列也是Pandas一个特色。

15K100
领券