首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Pandas速查手册中文版

所以在这里我们汇总一下 Pandas官方文档 中比较常用函数和方法,以方便大家记忆。同时,我们提供一个PDF版本,方便大家打印。 ...([col1,col2]):返回一个按进行分组Groupby对象 df.groupby(col1)[col2]:返回按col1进行分组后,col2均值 df.pivot_table(index...每一行应用函数np.max 数据合并 df1.append(df2):df2行添加到df1尾部 df.concat([df1, df2],axis=1):df2添加到df1尾部 df1....join(df2,on=col1,how='inner'):对df1df2执行SQL形式join 数据统计 df.describe():查看数据值汇总统计 df.mean():返回所有均值...df.corr():返回之间相关系数 df.count():返回每一列非空值个数 df.max():返回每一列最大值 df.min():返回每一列最小值 df.median():返回每一列中位数

12.1K92

建议收藏:12个Pandas数据处理高频操作

简单说说 总结分享 > 1 统计一行/一列数据负数出现次数 > 2 让dataframe里面的正数全部变为0 > 3 统计某各元素出现次数 > 4 修改表头和索引 > 5 修改所在位置insert...pip install pandas 在Python代码中使用pandas首先需要导入,: import pandas as pd 创建一个示例数据: # 统计一行/一列数据负数出现次数 df...(f"df\n{df}\ndf1\n{df1}") 原数据dfname第一个元素改为zs,会发现,df改动,不会影响df1。...> 12 对于/行操作 删除指定行/ # 行索引/索引 多行/可以用列表 # axis=0表示行 axis=1表示 inplace是否在原列表操作 # 删除dfc df.drop(...,也欢迎大家留言区留言说说你平时pandas比较操作呀~互相学习,才能一起进步,更快进步。

2.6K20

直观地解释和可视化每个复杂DataFrame操作

大多数数据科学家可能会赞扬Pandas进行数据准备能力,但许多人可能无法利用所有这些能力。...我们选择一个ID,一个维度和一个包含值/。包含值转换为两一列用于变量(值名称),另一列用于值(变量包含数字)。 ?...Unstack 取消堆叠获取索引DataFrame并对其进行堆叠,指定级别的索引转换为具有相应值新DataFrame。在表上调用堆栈后再调用堆栈不会更改该堆栈(原因是存在“ 0 ”)。...例如,考虑使用pandas.concat([df1df2])串联具有相同列名 两个DataFrame df1df2 : ?...尽管可以通过axis参数设置为1来使用concat进行列式联接,但是使用联接 会更容易。 请注意,concat是pandas函数,而不是DataFrame之一。

13.3K20

Pandas知识点-算术运算函数

() df1.pow(df2) 计算df1df2次方,df1^df2 rpow() df1.rpow(df2) 计算df2df1次方,df2^df1Pandas,这些函数用法和运算规则都相同...Series数字相加时,DataFrame相同,也是Series每一个数都与指定数字相加,返回一个新Series。 四、两个DataFrame算术运算 1....在SeriesDataFrame进行算术运算时,默认会将Series看成是一行数据(而不是一列),在add()函数,axis参数默认为1或'columns'。...如果Series索引DataFrame索引相同,会将Series依次DataFrame每一行数据进行运算,得到一个新DataFrame。 2....如果Series索引DataFrame行索引对应,要使Series按DataFrame运算,可以axis参数设置成0或'index',这样会将Series依次DataFrame一列数据进行运算

1.9K40

Python 数据分析(三):初识 Pandas

Pandas 适用于处理以下类型数据: 有序和无序时间序列数据 带行列标签矩阵数据,包括同构或异构型数据 SQL 或 Excel 表类似的,含异构表格数据 任意其它形式观测、统计数据集,...数据转入 Pandas 数据结构时不必事先标记 Pandas 主要数据结构是 Series(一维数据) DataFrame(二维数据),这两种数据结构足以处理金融、统计等领域里大多数典型用例。...DataFrame DataFrame 是一种二维数据结构,类似于 Excel 、SQL 表或 Series 对象构成字典,DataFrame 是最常用 Pandas 对象, Series 一样,...print(df[1:2]) # 获取多行 print(df[1:4]) # 多行一列数据 print(df[1:4][['name']]) # 某一行某一列数据 print(df.loc[1, '...name']) # 某一行指定数据 print(df.loc[1, ['name', 'age']]) # 某一行所有数据 print(df.loc[1, :]) # 连续多行和间隔 print

1.6K20

pandas技巧4

# 返回一个按col进行分组Groupby对象 df.groupby([col1,col2]) # 返回一个按进行分组Groupby对象 df.groupby(col1)[col2].agg(....transform("sum") # 通常groupby连用,避免索引更改 数据合并 df1.append(df2) # df2行添加到df1尾部 df.concat([df1, df2],...axis=1,join='inner') # df2添加到df1尾部,值为空对应行对应列都不要 df1.join(df2.set_index(col1),on=col1,how='inner...') # 对df1df2执行SQL形式join,默认按照索引来进行合并,如果df1df2有共同字段时,会报错,可通过设置lsuffix,rsuffix来进行解决,如果需要按照共同进行合并...() #查看数据值汇总统计 df.mean() # 返回所有均值 df.corr() # 返回之间相关系数 df.count() # 返回每一列非空值个数 df.max() # 返回每一列最大值

3.4K20

小蛇学python(15)pandas之数据合并

在pythonpandas,合并数据共有三种思路。 其一,关系型数据库模式连接操作。 其二,沿轴多个操作对象拼接在一起。 其三,对互有重复数据处理合并。 我们分别来进行介绍。...image.png 这里,并没有指定要用哪个进行连接,如果没有指定,就会默认重叠列名当作连接键。这里连接结果是按照笛卡儿积逻辑实现。在这个例子中表现不太明显,我们再看下一个例子。...image.png 我们看到,表格1里有3个b,表格2里有2个b,所以最终合并表格里就有6个b,这就是所谓笛卡尔乘积。在这里我也用了参数on,它作用就是指定两个表格按照哪一列合并。...image.png 有一种很常见情况,就是表格连接键位于索引。看下面这个例子如何解决。...它还可以用于合并多个带有相同或者相似索引DataFrame对象。 这里就举一个例子,因为这个方法比较简单。

1.6K20

灰太狼数据世界(三)

比如说我们现在有这样一张表,那么把这张表做成dataframe,先把每一列都提取出来,然后这些在数据都放到一个大集合里,在这里我们使用字典。...):查看DataFrame对象一列唯一值和计数 print(df.head(2)) print(df[0:2]) ?...在DataFrame增加一列,我们可以直接给值来增加一列,就和python字典里面添加元素是一样: import pandas as pd import numpy as np val = np.arange...下面我们简单介绍一下: 选择一列: data['column_name'] 选择一列前几行数据: data['columns_name'][:n] 选择: data[['column1','column2...apply函数可以对DataFrame对象进行操作,既可以作用于一行或者一列元素,也可以作用于单个元素。apply最神奇地方就是它里面可以调用函数,我们经常在apply里面写一些功能匿名函数。

2.8K30

数据城堡参赛代码实战篇(四)---使用pandas合并数据表

那么我们如何这一系列数据文件合并成一个文件呢?pandas提供了多种对数据进行合并方法,不过本文主要介绍是merge()方法应用。...,那么pandas会自动搜索两个DataFrame相同,如果有,则按该进行合并,如果没有,则会报下面的错: pandas.tools.merge.MergeError: No common columns...相同进行合并,所以上述代码下面的代码效果是一样: (pd.merge(df1,df2,on='key')) 如果两个数据表没有相同呢?...和df4key2进行合并,结果值都是相同。...(inner),结果键是交集,即只有key值为‘a'和’b',因此上述合并df1df2代码和下面的代码等同: pd.merge(df1,df2,how='inner') 另一个需要注意地方是

1.7K60

Pandas教程】像写SQL一样用Pandas

筛选 SQL select city, country from table_name Pandas # 筛选一列 # 这样返回是series data['City'].head() # 这样返回是...-- 筛选前100行 select * from table_name limit 100 Pandas pandas支持方式就比较多了,如果你了解python切片操作,以下应该会比较好理解。...行奇数行,2到10每隔3一列 data.iloc[1:10:2,2:10:3] # 筛选第2和第4行,第3和第5 data.iloc[[2,4],[3,5]] 根据条件筛选 SQL select...()和apply()区别: map():是pandas.Series()内置方法,也就是说只能用于单一列,返回是数据是Series()格式; apply():可以用于单列或者,是对整个DataFrame...,如果merge()类比为join操作,接下来讲拼接类似于SQLunion all操作。

2.2K30

妈妈再也不用担心我忘记pandas操作了

df.mean() # 返回所有均值 df.corr() # 返回之间相关系数 df.count() # 返回每一列非空值个数 df.max() # 返回每一列最大值 df.min...() # 返回每一列最小值 df.median() # 返回每一列中位数 df.std() # 返回每一列标准差 数据合并: df1.append(df2) # df2行添加到df1尾部...df.concat([df1, df2],axis=1) # df2添加到df1尾部 df1.join(df2,on=col1,how='inner') # 对df1df2执行SQL...升序排列,后按col2降序排列数据 df.groupby(col) # 返回一个按col进行分组Groupby对象 df.groupby([col1,col2]) # 返回一个按进行分组Groupby...(np.mean) # 对DataFrame一列应用函数np.mean data.apply(np.max,axis=1) # 对DataFrame每一行应用函数np.max 其它操作: 改列名

2.2K31

Pandas进阶修炼120题|当Pandas遇上NumPy

:⭐⭐ 答案 df = pd.concat([df1,df2,df3],axis=0,ignore_index=True) 86 数据创建 题目:df1df2,df3按照合并为新DataFrame...75, 100])) 88 数据修改 题目:修改列名为col1,col2,col3 难度:⭐ 答案 df.columns = ['col1','col2','col3'] 89 数据提取 题目:提取第一列不在第二出现数字...(df['col1'] % 5==0) 92 数据计算 题目:计算第一列数字前一个后一个差值 难度:⭐⭐ 答案 df['col1'].diff().tolist() 93 数据处理 题目:col1...='valid') 98 数据修改 题目:数据按照第三大小升序排列 难度:⭐⭐ 答案 df.sort_values("col3",inplace=True) 99 数据修改 题目:一列大于50...数字修改为'高' 难度:⭐⭐ 答案 df.col1[df['col1'] > 50]= '高' 100 数据计算 题目:计算第一列第二之间欧式距离 难度:⭐⭐⭐ 备注 不可以使用自定义函数 答案

96120
领券