首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

疫情这么严重,还不待家里学Numpy和Pandas

#获取第一行,0前面要加逗号,不然打印类型出来 a[:,0] #获取第一,0后面加逗号 a[0,:] #轴计算:axis=1 计算每一行平均值 a.mean(axis=1) pandas二维数组...saleDf.mean() #查询第一行第二元素 salesDf.iloc[0.1] #获取第一行,代表所有 salesDf.iloc[0,:] #获取第一,代表所有 salesDf.iloc.../pandas-docs/stable/generated/pandas.DataFrame.dropna.html #删除(销售时间,社保卡号)中为空 #how='any' 在给定任何一中有缺失值就删除...ascending=True naposition='first') #重命名行号(index)排序后索引号是之前行号,需要修改成0到N顺序索引值 salesDf=salesDf.reset_index...totalI=kpi1_Df.shape[0] #第一步,销售时间升序排序 kpil_Df=kpilDf.sort_value(by='销售时间', ascending=True) #重命名名(

2.5K41

Pandas速查手册中文版

df[[col1, col2]]:以DataFrame形式返回 s.iloc[0]:位置选取数据 s.loc['index_one']:索引选取数据 df.iloc[0,:]:返回第一行 df.iloc...pd.notnull():检查DataFrame对象中非空值,并返回一个Boolean数组 df.dropna():删除所有包含空值 df.dropna(axis=1):删除所有包含空值 df.dropna...(axis=1,thresh=n):删除所有小于n个非空值 df.fillna(x):用x替换DataFrame对象中所有的空值 s.astype(float):将Series中数据类型更改为float...], ascending=[True,False]):先按col1升序排列,后col2降序排列数据 df.groupby(col):返回一个col进行分组Groupby对象 df.groupby...([col1,col2]):返回一个进行分组Groupby对象 df.groupby(col1)[col2]:返回col1进行分组后,col2均值 df.pivot_table(index

12.1K92
您找到你想要的搜索结果了吗?
是的
没有找到

Pandas速查卡-Python数据科学

开始学习pandas时要记住所有常用函数和方法显然是有困难,所以在Dataquest(https://www.dataquest.io/)我们主张查找pandas参考资料(http://pandas.pydata.org...pd.notnull() 与pd.isnull()相反 df.dropna() 删除包含空值所有 df.dropna(axis=1) 删除包含空值所有 df.dropna(axis=1,thresh...=n) 删除所有小于n个非空值 df.fillna(x) 用x替换所有空值 s.fillna(s.mean()) 将所有空值替换为均值(均值可以用统计部分中几乎任何函数替换) s.astype(float...0.5 df[(df[col] > 0.5) & (1.7)] 0.7> col> 0.5 df.sort_values(col1) 将col1升序对值排序 df.sort_values(col2...(col) 从一返回一组对象值 df.groupby([col1,col2]) 返回一组对象值 df.groupby(col1)[col2] 返回col2中平均值,col1中值分组

9.2K80

妈妈再也不用担心我忘记pandas操作了

,并以Series形式返回 df[[col1, col2]] # 以DataFrame形式返回 df.iloc[0] # 位置选取数据 df.loc['index_one'] # 索引选取数据...df.iloc[0,:] # 返回第一行 df.iloc[0,0] # 返回第一第一个元素 数据统计: df.describe() # 查看数据值汇总统计 df.mean() # 返回所有均值...> 0.5] # 选择col值大于0.5 df.sort_values(col1) # 按照col1排序数据,默认升序排列 df.sort_values(col2, ascending=False...(col) # 返回一个col进行分组Groupby对象 df.groupby([col1,col2]) # 返回一个进行分组Groupby对象 df.groupby(col1)[col2...,并计算col2和col3最大值数据透视表 df.groupby(col1).agg(np.mean) # 返回col1分组所有均值 data.apply(np.mean) # 对DataFrame

2.2K31

首次公开,用了三年 pandas 速查表!

+Tab(1-3次):查看函数方法说明 D, D:双击 D 删除本行 A / B:向上 / 下增加一行 M / Y:Markdown / 代码模式 03 导入库包 import pandas as pd...df.drop([0, 10], axis=0) # 删除 del df['name'] # 删除 df.dropna() # 删除所有包含空值 df.dropna(axis=1) # 删除所有包含空值...取列名两个方法 df[df.index == 'Jude'] # 索引查询要用 .index df[df[col] > 0.5] # 选择col值大于0.5 # 多条件查询 df[(df['...(s > 0) # 留下满足条件,其他默认为 NaN # 所有值加 1 (加减乘除等) df + 1 / df.add(1) # 管道方法,链式调用函数,f(df)=df.pipe(f) def gb...形式返回 df.loc[df['team'] == 'B',['name']] # 条件查询,只显示name s.iloc[0] # 位置选取数据 s.loc['index_one'] #

7.4K10

一场pandas与SQL巅峰大战

2.查询特定数据 有的时候我们只想查看某几列数据。在pandas里可以使用中括号或者loc,iloc等多种方式进行列选择,可以选择一。...5.查询带有多个条件数据。 多个条件同时满足情况 在前一小结基础上,pandas需要使用&符号连接多个条件,每个条件需要加上小括号;SQL需要使用and关键字连接多个条件。...多个条件满足其中一个情况 与多个条件同时满足使用&相对应,我们使用|符号表示一个条件满足情况,而SQL中则用or关键字连接各个条件表示任意满足一个。...SQL操作时基本也是同样逻辑,要指定主表,表,连接方式和连接字段。此处我们使用user连接order并查询所有字段和所有记录。...删除操作可以细分为删除操作和删除操作。对于删除操作,pandas删除可以转换为选择不符合条件进行操作。SQL需要使用delete关键字。

2.2K20

超全pandas数据分析常用函数总结:下篇

6.1 单行索引 data.loc[6] # 提取索引值为6一行(即输出第7) 输出结果: ?...6.2 区域索引 6.2.1 用loc取连续多行 提取索引值为2到索引值为4所有,即提取第3到第5,注意:此时切片开始和结束都包括在内。 data.loc[2:4] 输出结果: ?...6.2.5 用iloc取连续多行和 提取第3到第6,第4到第5值,取得是交叉点位置。 data.iloc[2:6,3:5] 输出结果: ?...6.2.6 用iloc取不连续多行和 提取第3和第6,第4和第5交叉值 data.iloc[[2,6],[3,5]] 输出结果: ?...6.2.7 用iloc取具体值 提取第3第7值 data.iloc[2,6] 输出结果:‘high’ 总结:文字变代码,数值少1;代码变文字,数值加1;代码0开始计数;文字1开始计数。

4.8K20

超全pandas数据分析常用函数总结:下篇

6.1 单行索引 data.loc[6] # 提取索引值为6一行(即输出第7) 输出结果: ?...6.2 区域索引 6.2.1 用loc取连续多行 提取索引值为2到索引值为4所有,即提取第3到第5,注意:此时切片开始和结束都包括在内。 data.loc[2:4] 输出结果: ?...6.2.5 用iloc取连续多行和 提取第3到第6,第4到第5值,取得是交叉点位置。 data.iloc[2:6,3:5] 输出结果: ?...6.2.6 用iloc取不连续多行和 提取第3和第6,第4和第5交叉值 data.iloc[[2,6],[3,5]] 输出结果: ?...6.2.7 用iloc取具体值 提取第3第7值 data.iloc[2,6] 输出结果:‘high’ 总结:文字变代码,数值少1;代码变文字,数值加1;代码0开始计数;文字1开始计数。

3.8K20

Python数据分析实战基础 | 清洗常用4板斧

上文我们合并后df数据集就是有缺失数据: 要删除空值,一个dropna即可搞定: dropna函数默认删除所有出现空值,即只要一行中任意一个字段为空,就会被删除。...,要基于“流量级别”这进行去重,则可以: 我们会发现,流量有三个级别,通过指定subset参数,我们删除了这个字段重复,保留了各自不重复一行。...继续展开讲,在源数据中,流量渠道为“一级”有7数据,每行数据其他字段都不相同,这里我们删除了后6,只保留了第一行,但如果我们想在去重过程中删除前面6,保留最后一行数据怎么操作?...keep值等于last,保留最后一行数据,不输入keep值时,系统默认会给keep赋值为first,就会保留第一行数据而删掉其他。...,ascending参数决定了排序顺序,等于Flase则是大到小降序,设置为True则是升序

2K21

最全面的Pandas教程!没有之一!

现有的创建新: ? DataFrame 里删除/ 想要删除一行或一,可以用 .drop() 函数。...如果你确定要永久性删除一行/,你需要加上 inplace=True 参数,比如: ?...获取 DataFrame 中一行或多行数据 要获取某一行,你需要用 .loc[] 来索引(标签名)引用这一行,或者用 .iloc[],这行在表中位置(行数)来引用。 ?...此外,你还可以制定多行和/或,如上所示。 条件筛选 用中括号 [] 方式,除了直接指定选中某些外,还能接收一个条件语句,然后筛选出符合条件/。...你可以用逻辑运算符 &(与)和 |(或)来链接多个条件语句,以便一次应用多个筛选条件到当前 DataFrame 上。举个栗子,你可以用下面的方法筛选出同时满足 'W'>0 和'X'>1 : ?

25.8K64

Shell实用工具

命令: 删除第1,第4数据 sed '1d;4d' sed.txt ? 演示2: 删除奇数 一行开始删除,每隔2就删掉一行。...演示3: 删除指定范围多行数据 删除第1到第3数据 sed '1,3d' sed.txt # 1,3 指定第1开始到第3结束 ?...演示3: 删除指定范围取反多行数据 删除第1到第3取反数据 sed '1,3!d' sed.txt # 1,3! 指定第1开始到第3结束取反, 就是不在这个范围 ?...演示2: 第一行删除后粘贴到最后1 将模式空间第一行复制到暂存空间(覆盖方式)并删除, 最后将暂存空间内容复制到模式空间中最后一行(追加方式) sed '1{h;d};$G' sed.txt #...演示3: 第一行数据复制粘贴替换其他行数据 将模式空间第一行复制到暂存空间(覆盖方式), 最后将暂存空间内容复制到模式空间中替换第2开始最后一行一行数据(覆盖方式) sed '1h;2,$g

7.8K10

14个pandas神操作,手把手教你写代码

、处理缺失值、填充默认值、补全格式、处理极端值等; 建立高效索引; 支持大体量数据; 一定业务逻辑插入计算后删除; 灵活方便数据查询、筛选; 分组聚合数据,可独立指定分组后各字段计算方式...图2 读取数据执行效果 其中: 自动增加了第一,是Pandas为数据增加索引,0开始,程序不知道我们真正业务索引,往往需要后面重新指定,使它有一定业务意义; 由于数据量大,自动隐藏了中间部分...选择可以用以下方法: # 选择 df[['team', 'Q1']] # 只看这两,注意括号 df.loc[:, ['team', 'Q1']] # 和上一行效果一样 df.loc[x...四个季度成绩 df.loc['Eorge':'Alexander', 'team':'Q4'] # 指定区间 (4)条件选择 一定条件显示数据: # 单一条件 df[df.Q1 > 90]...df.mean() # 返回所有均值 df.mean(1) # 返回所有均值,下同 df.corr() # 返回之间相关系数 df.count() # 返回每一非空值个数

3.3K20

手把手教你做一个“渣”数据师,用Python代替老情人Excel

5、略过 默认read_excel参数假定第一行是列表名称,会自动合并为DataFrame中标签。...这只是个开始,并不是所有的功能,但已足够你“尝鲜”了。 二、查看数据属性 现在我们有了DataFrame,可以多个角度查看数据了。...Pandas有很多我们可以使用功能,接下来将使用其中一些来看下我们数据集。 1、“头”到“脚” 查看第一行最后。默认值为5,也可以自定义参数。 ? 2、查看特定数据 ?...2、查看 ? 3、查看特定 这里使用方法是loc函数,其中我们可以指定以冒号分隔起始行和结束。注意,索引0开始而不是1。 ? 4、同时分割 ? 5、在某一中筛选 ?...8、筛选不在列表或Excel中值 ? 9、用多个条件筛选数据 输入应为一个表,此方法相当于excel中高级过滤器功能: ? 10、根据数字条件过滤 ?

8.3K30

Pandas知识点-排序操作

数据处理过程中,经常需要对数据进行排序,使数据指定顺序排列(升序或降序)。 在Pandas中,排序功能已经实现好了,我们只需要调用对应方法即可。...为了方便后面进行排序操作,只读取了数据中前十,并删除了一些,设置“日期”和“收盘价”为索引。 ? 读取原始数据如上图,本文基于这些数据来进行排序操作。 二、DataFrame排序操作 1....axis: 排序默认是索引排序(对每一行数据排序),axis参数默认为0,将axis参数设置成1则索引排序(对每一数据排序)。不过,在实际应用中,对排序情况是极少。...,显示成数值型索引(排序完成后0开始编号)。...na_position参数只支持单列排序时使用,在按多重索引或排序时无效。

1.7K30

Python数据分析笔记——Numpy、Pandas

(2)DataFrame与Series之间运算 将DataFrame一行与Series分别进行运算。...(1)Series数据结构排序和排名 a、索引值进行排序 b、值进行排序 默认情况下,排序是升序排列,但也可通过ascending=False进行降序排列。...obj.rank() (2)DataFrame数据结构排序和排名 索引值进行排列,一值进行排序,通过by将列名传递给sort_index. 5、缺失数据处理 (1)滤出缺失数据 使用data.dropna...传入how=‘all’将只滤出全是缺失值一行。 要用这种方式滤出列,只需传入axis=1即可。...(0开始计数) 6、汇总和计算描述统计 就是针对数组进行常用数学和统计运算。大部分都属于约简和汇总统计。 其中有求和(sum)运算、累计(cumsum)运算、平均值(mean)等运算。

6.4K80

Pandas Sort:你 Python 数据排序指南

列上对 DataFrame 进行排序 升序排序 更改排序顺序 降序排序 具有不同排序顺序排序 根据索引对 DataFrame 进行排序 升序索引排序 索引降序排序 探索高级索引排序概念...都有索引,它是数据在 DataFrame 中位置数字表示。您可以使用 DataFrame 索引位置特定中检索数据。默认情况下,索引号从零开始。您也可以手动分配自己索引。...索引不被视为一,您通常只有一个索引。索引可以被认为是从零开始行号。...您可以看到更改顺序也会更改值排序顺序。 降序排序 到目前为止,您仅对升序排序。在下一个示例中,您将根据make和model降序排序。...对于文本数据,排序区分大小写,这意味着大写文本将首先按升序出现,最后降序出现。 具有不同排序顺序排序 您可能想知道是否可以使用多个进行排序并让这些使用不同ascending参数。

13.8K00

猿创征文|数据导入与预处理-第3章-pandas基础

BSD开源协议可以自修改源代码,也可以将修改后代码作为开源或者专有软件再发布。 但需要满足三个条件: 1.如果再发布产品中包含源代码,则在源代码中必须带有原来代码中BSD协议。...Series类对象索引样式比较丰富,默认是自动生成整数索引(0开始递增),也可以是自定义标签索引(由自定义标签构成索引)、时间戳索引(由时间戳构成索引)等。...DataFrame类对象索引位于最左侧一索引位于最上面一行,且每个索引对应着一数据。DataFrame类对象其实可以视为若干个公用索引Series类对象组合。...axis:表示轴编号(排序方向),0代表排序,1代表排序。 ascending:表示是否以升序方式排序,默认为True。若设置为False,则表示降序方式排序。...),0代表排序,1代表排序。

13.9K20

一场pandas与SQL巅峰大战

2.查询特定数据 有的时候我们只想查看某几列数据。在pandas里可以使用中括号或者loc,iloc等多种方式进行列选择,可以选择一。...5.查询带有多个条件数据。 多个条件同时满足情况 在前一小结基础上,pandas需要使用&符号连接多个条件,每个条件需要加上小括号;SQL需要使用and关键字连接多个条件。...多个条件满足其中一个情况 与多个条件同时满足使用&相对应,我们使用|符号表示一个条件满足情况,而SQL中则用or关键字连接各个条件表示任意满足一个。...SQL操作时基本也是同样逻辑,要指定主表,表,连接方式和连接字段。此处我们使用user连接order并查询所有字段和所有记录。...删除操作可以细分为删除操作和删除操作。对于删除操作,pandas删除可以转换为选择不符合条件进行操作。SQL需要使用delete关键字。

1.6K10
领券