首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas进阶修炼120题,给你深度和广度的船新体验

深度和广度上,都相较之前的Pandas习题系列有了很大的提升。...('pandas120.xlsx') 22.查看df数据前5 df.head() 23.将salary列数据转换为最大值与最小值的平均值 #备注,某些版本pandas中.ix方法可能失效,可使用...'education').mean()) 25.将createTime列时间转换为月-日 #备注,某些版本pandas中.ix方法可能失效,可使用.iloc,参考https://mp.weixin.qq.com...(tem == -2)[0] + 1 96.计算df的每一均值 df[['col1','col2','col3']].mean(axis=1) 97.对第二列计算移动平均值 #备注 每次移动三个位置...float(x) > 10000 else '低'} ) df 103.从上一题数据中,对薪资水平列每隔20进行一次抽样 df.iloc[::20, :][['薪资水平']] 104.将数据取消使用科学计数法

6K31

python数据分析——数据预处理

d = df.shape[0] #打印行数和列数 w = df.shape[1] print("数据的行数%d "%d) print('数据的列数 %d'%w) 1.3数据格式的查看 【例】请利用Python...本小节后续案例中所用的df数据如下,在案例中将不再重复展示。 【例】使用近邻填补法,即利用缺失值最近邻居的值来填补数据,对df数据中的缺失值进行填补,这种情况该如何实现?...本节各案例所用到的df数据如下,各案例的代码展示中将不再重复这部分内容。 【例】请使用Python检查df数据中的重复值。 关键技术: duplicated方法。...若要向df数据中再增加三数据,索引分别为"e" , “f” , “g”,数值分别为[1,2,3], [4,5,6], [7,8,9],Python中该如何实现?...drop()方法的参数说明如下: labels:表示标签或列标签。 axis: axis=0,表示删除,axis=1,表示列删除。默认值为0。 index:删除,默认为None。

25110
您找到你想要的搜索结果了吗?
是的
没有找到

Pandas速查卡-Python数据科学

刚开始学习pandas时要记住所有常用的函数和方法显然是有困难的,所以Dataquest(https://www.dataquest.io/)我们主张查找pandas参考资料(http://pandas.pydata.org...col的列 df[[col1, col2]] 作为新的数据框返回列 s.iloc[0] 位置选择 s.loc['index_one'] 索引选择 df.iloc[0,:] 第一 df.iloc[0,0...(1,'one') 将所有等于1的值替换为'one' s.replace([1,3],['one','three']) 将所有1换为'one',将3替换为'three' df.rename(columns...0.5) & (1.7)] 0.7> col> 0.5的 df.sort_values(col1) 将col1升序对值排序 df.sort_values(col2,ascending=False)...(col1).agg(np.mean) 查找每个唯一col1组的所有列的平均值 data.apply(np.mean) 每个列上应用函数 data.apply(np.max,axis=1) 每行上应用一个函数

9.2K80

Numpy和pandas的使用技巧

换为90 print(b) 指定轴求和 np.sum(参数1: 数组; 参数2: axis=0/1,0表示列1表示) 指定轴最大值np.max(参数1: 数组; 参数2: axis...=0/1,0表示列1表示) 指定轴最小值np.min(参数1: 数组; 参数2: axis=0/1,0表示列1表示) 或列最大值索引np.argmax(参数1: 数组; 参数2: axis...=0/1,0表示列1表示) 或列最小值索引np.argmin(参数1: 数组; 参数2: axis=0/1,0表示列1表示) 指定轴平均值mean(参数1: 数组; 参数2: axis...=1) 纵向 pd.concat([a,a],axis=0) 数据去重 import pandas as pd df = pd.DataFrame([[1,2,3],[2,3,4],[1,2,3]])...+m #代码块前增加新代码块,a;代码块后增加新代码块,b; #删除代码块,dd #运行当前代码块,Ctrl+Enter #运行当前代码块并选中下一个代码块(没有就创建),Shift+Enter

3.5K30

Pandas进阶修炼120题|完整版

答案 df.head() 23 数据计算 题目:将salary列数据转换为最大值与最小值的平均值 难度:⭐⭐⭐⭐ 期望输出 ?...) 备注 axis:0-操作(默认),1-列操作 how:any-只要有空值就删除(默认),all-全部为空值才删除 inplace:False-返回新的数据集(默认),True-原数据集上操作 57...题目:提取第一列位置1,10,15的数字 难度:⭐⭐ 答案 df['col1'].take([1,10,15]) 95 数据查找 题目:查找第一列的局部最大值位置 难度:⭐⭐⭐⭐ 备注 即比它前一个与后一个数字的都大的数字...答案 tem = np.diff(np.sign(np.diff(df['col1']))) np.where(tem == -2)[0] + 1 96 数据计算 题目:计算df的每一均值 难度...('salary',ascending=False).head(1) 以上就是Pandas进阶修炼120题全部内容,如果能坚持走到这里的读者,我想你已经掌握了处理数据的常用操作,并且之后的数据分析中碰到相关问题

11.6K106

玩转数据处理120题|Pandas版本

Python解法 df.head() 23 数据计算 题目:将salary列数据转换为最大值与最小值的平均值 难度:⭐⭐⭐⭐ 期望输出 ?...axis:0-操作(默认),1-列操作 how:any-只要有空值就删除(默认),all-全部为空值才删除 inplace:False-返回新的数据集(默认),True-原数据集上操作 57 数据可视化...() 73 数据重采样 题目:周为采样规则,取一周收盘价最大值 难度:⭐⭐⭐ Python解法 df = df.set_index('日期') df['收盘价(元)'].resample('W...([1,10,15]) # 等价于 df.iloc[[1,10,15],0] 95 数据查找 题目:查找第一列的局部最大值位置 难度:⭐⭐⭐⭐ 备注 即比它前一个与后一个数字的都大的数字 Python解法...dtype=int64) 96 数据计算 题目:计算df的每一均值 难度:⭐⭐ Python解法 df[['col1','col2','col3']].mean(axis=1) 97 数据计算

7.4K40

8个Python高效数据分析的技巧。

1代码定义List 定义某种列表时,写For 循环过于麻烦,幸运的是,Python有一种内置的方法可以代码中解决这个问题。下面是使用For循环创建列表和用一代码创建列表的对比。...具体来说,map通过对列表中每个元素执行某种操作并将其转换为新列表。 本例中,它遍历每个元素并乘以2,构成新列表。 (注意!...我们用删除一列()的例子: df.drop('Column A', axis=1) df.drop('Row A', axis=0) 如果你想处理列,将Axis设置为1,如果你想要处理,将其设置为0...但它不某个指定的主键合并,而是根据相同的列名或名合并。 ? 7 Pandas Apply Apply是为Pandas Series而设计的。...) A B 0 2.0 3.0 1 2.0 3.0 2 2.0 3.0 df.apply(np.sum, axis=0) A 12 B 27 df.apply

2.2K10

精心整理 | 非常全面的Pandas入门教程

作者:石头 | 来源:机器学习那些事 pandas是基于NumPy的一种数据分析工具,机器学习任务中,我们首先需要对数据进行清洗和编辑等工作,pandas库大大简化了我们的工作量,熟练并掌握pandas...如何安装Pandas 最常用的方法是通过Anaconda安装,终端或命令符输入如下命令安装: conda install pandas 若未安装Anaconda,使用Python自带的包管理工具pip...和列获取最大值 print(df.iat[row[0], col[0]]) df.iloc[row[0], col[0]] # 索引和列名获取最大值 df.at[row[0], 'Price']...print(df) # 取'a'列前3个最大值对应的 n = 5 df['a'].argsort()[::-1].iloc[:3] #> a b c 0 5 5 2...df.loc['A'].iloc[1]['fea1'] #> -0.7944609970323794 六、小结 pandas机器学习项目中的应用主要有两个步骤:(1)读取文件,(2)数据清洗和编辑工作

9.9K53

8 个 Python 高效数据分析的技巧

Lambda表达式用于Python中创建小型,一次性和匿名函数对象。它能你创建一个函数。...具体来说,map通过对列表中每个元素执行某种操作并将其转换为新列表。本例中,它遍历每个元素并乘以2,构成新列表。请注意,list()函数只是将输出转换为列表类型。...我们用删除一列()的例子: df.drop( Column A , axis=1) df.drop( Row A , axis=0) 如果你想处理列,将Axis设置为1,如果你想要处理,将其设置为0...但它不某个指定的主键合并,而是根据相同的列名或名合并。 ? Pandas Apply pply是为Pandas Series而设计的。...) A B 0 2.0 3.0 1 2.0 3.0 2 2.0 3.0 df.apply(np.sum, axis=0) A 12 B 27 df.apply

2.7K20

Pandas必会的方法汇总,数据分析必备!

df.head() 查询数据的前五 2 df.tail() 查询数据的末尾5 3 pandas.qcut() 基于秩或基于样本分位数将变量离散化为等大小桶 4 pandas.cut() 基于分位数的离散化函数...举例:索引提取单行的数值 df_inner.loc[3] 四、DataFrame选取和重新组合数据的方法 序号 方法 说明 1 df[val] 从DataFrame选取单列或一组列;特殊情况下比较便利...,选取单列或列子集 4 df.1oc[val1,val2] 通过标签,同时选取和列 5 df.iloc[where] 通过整数位置,从DataFrame选取单个子集 6 df.iloc[where_i...,where_j] 通过整数位置,同时选取和列 7 df.at[1abel_i,1abel_j] 通过和列标签,选取单一的标量 8 df.iat[i,j] 通过和列的位置(整数),选取单一的标量...9 reindex 通过标签选取或列 10 get_value 通过和列标签选取单一值 11 set_value 通过和列标签选取单一值 举例:使用iloc位置区域提取数据 df_inner.iloc

5.9K20

Pandas必会的方法汇总,建议收藏!

举例:索引提取单行的数值 df_inner.loc[3] 四、DataFrame选取和重新组合数据的方法 序号 方法 说明 1 df[val] 从DataFrame选取单列或一组列;特殊情况下比较便利...,选取单列或列子集 4 df.1oc[val1,val2] 通过标签,同时选取和列 5 df.iloc[where] 通过整数位置,从DataFrame选取单个子集 6 df.iloc[:,where...] 通过整数位置,从DataFrame选取单个列或列子集 7 df.iloc[where_i,where_j] 通过整数位置,同时选取和列 8 df.at[1abel_i,1abel_j] 通过和列标签...通过和列标签选取单一值 举例:使用iloc位置区域提取数据 df_inner.iloc[:3,:2] #冒号前后的数字不再是索引的标签名称,而是数据所在的位置,从0开始,前三,前两列。...举例:按照索引列排序 df_inner.sort_index() 六、相关分析和统计分析 序号 方法 说明 1 .idxmin() 计算数据最小值所在位置的索引(自定义索引) 2 .idxmax() 计算数据最大值所在位置的索引

4.7K40

干货!直观地解释和可视化每个复杂的DataFrame操作

Unstack 取消堆叠将获取多索引DataFrame并对其进行堆叠,将指定级别的索引转换为具有相应值的新DataFrame的列。表上调用堆栈后再调用堆栈不会更改该堆栈(原因是存在“ 0 ”)。...可以按照与堆叠相同的方式执行堆叠,但是要使用level参数: df.unstack(level = -1)。 Merge 合并两个DataFrame是共享的“键”之间列(水平)组合它们。...例如,如果 df1 具有3个键foo 值, 而 df2 具有2个相同键的值,则 最终DataFrame中将有6个条目,其中 leftkey = foo 和 rightkey = foo。 ?...Concat 合并和连接是水平工作,串联或简称为concat,而DataFrame是(垂直)连接的。...例如,考虑使用pandas.concat([df1df2])串联的具有相同列名的 两个DataFrame df1df2 : ?

13.3K20

8个Python高效数据分析的技巧

Lambda表达式用于Python中创建小型,一次性和匿名函数对象。 它能你创建一个函数。...具体来说,map通过对列表中每个元素执行某种操作并将其转换为新列表。 本例中,它遍历每个元素并乘以2,构成新列表。 请注意,list()函数只是将输出转换为列表类型。...---- Pandas中,删除一列或在NumPy矩阵中求和值时,可能会遇到Axis。...我们用删除一列()的例子: 1df.drop('Column A', axis=1) 2df.drop('Row A', axis=0) 如果你想处理列,将Axis设置为1,如果你想要处理,将其设置为...但它不某个指定的主键合并,而是根据相同的列名或名合并。 ? Pandas Apply ---- ---- Apply是为Pandas Series而设计的。

2.1K20

这 8 个 Python 技巧让你的数据分析提升数倍!

Lambda表达式用于Python中创建小型,一次性和匿名函数对象。它能你创建一个函数。...具体来说,map通过对列表中每个元素执行某种操作并将其转换为新列表。本例中,它遍历每个元素并乘以2,构成新列表。请注意,list()函数只是将输出转换为列表类型。...我们用删除一列()的例子: df.drop( Column A , axis=1) df.drop( Row A , axis=0) 如果你想处理列,将Axis设置为1,如果你想要处理,将其设置为0...但它不某个指定的主键合并,而是根据相同的列名或名合并。 ? Pandas Apply ---- ---- Apply是为Pandas Series而设计的。...) A B 0 2.0 3.0 1 2.0 3.0 2 2.0 3.0 df.apply(np.sum, axis=0)A 12 B 27 df.apply

2K10

pandas与SQL的查询语句对比

pandas的官方文档中对常用的SQL查询语句与pandas的查询语句进行了对比,这里以 @猴子 社群里面的朝阳医院数据为例进行演示,顺便求第四关门票,整体数据结构如下: import pandas...(5) 商品名称 销售数量 0 三九感冒灵 7 1 三九感冒灵 3 2 三九感冒灵 3 3 三九感冒灵 1 4 三九感冒灵 8 2....["销售数量"] == 3 会返回一个包含True/False的Series对象: df['销售数量']==3 0 False 1 True 2 True 3...之后会返回值为True的 s = df['销售数量'] == 3 df[s].head(5) 购药时间 社保卡号 商品编码 商品名称 销售数量 应收金额 实收金额...GROUP BY Pandas中可以使用groupby()函数实现类似于SQL中的GROUP BY功能,groupby()能将数据集某一条件分为多个组,然后对其进行某种函数运算(通常是聚合运算)。

1K41

Pandas 表格样式设置指南,看这一篇就够了!

数据文件文末有获取方式。 数据1 消费行业指数基金相关的数据,导入如下: df_consume = pd.read_csv('....() highlight_between() highlight_max 通过 highlight_max()来高亮最大值,其中 axis=0列进行统计: df_consume.style.hide_index...subset=['2018','2019','2020']) 高亮最大值 highlight_min 通过 highlight_min()来高亮最小值,其中 axis=1行进行统计: df_consume.style.hide_index...其中: apply 通过axis参数,每一次将一列或一或整个表传递到DataFrame中。对于列使用 axis=0, 行使用 axis=1, 整个表使用 axis=None。...效果如下: 设置样式 # axis =1设置样式 df_consume.style.hide_index()\ .hide_columns(['性别','基金经理

2.8K21
领券