前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python数据分析—数据框的简单操作

Python数据分析—数据框的简单操作

作者头像
阿黎逸阳
发布2020-11-24 11:29:56
1.4K0
发布2020-11-24 11:29:56
举报

本文是数据分析的第三课,教大家如何在python中对数据框进行简单操作,包括更改列名、显示某列中的部分字符、对某列的数值型数据进行取整等。

本文目录

  1. 更改列名
  2. 显示某列中的部分字符
  3. 抽取某列的部分字符,加别的字符构成新列
  4. 对数值型的列取四舍五入

注意:本文沿用数据分析第一课【Python数据分析—数据建立】里的数据框date_frame:

1 更改列名

更改列名有两种方法。

第一种方法:数据框的名字.columns = 新列名对应的列表。

第二种方法:数据框的名字.rename(columns = {'旧列名1':'新列名1', '旧列名2':'新列名2', ...}),这种方法可以更改部分列名,也可以更改全部的列名。

假设我想更改date_frame中的列名,可以在jupyter中输入如下代码:

date_frame.columns = ['学号', '姓名', '性别', '年龄', '身高']  #方法一

得到结果如下:

也可以在jupyter中输入如下代码:

date_frame.rename(columns = {'ID':'学号', 'height':'身高'})  #方法二

得到结果如下:

2 显示某列中的部分字符

假设我要取班上所有同学的姓,可以在jupyter中运行如下语句:

date_frame.name.str[0:1]

得到结果如下:

其中.name表示要取的列,.str[0:1]表示取该列中每个字符的第一个字。

如果要取每个同学的名字,可以在jupyter中运行如下语句:

date_frame.name.str[1:]

得到结果如下:

其中.name表示要取的列,.str[1:]表示取该列中第二个字符后的所有字符。

同样的办法大家可以试试取学号的前几位,看看下面这个语句在jupyter中会得到什么结果:

date_frame.ID.str[2:5]

3 抽取某列的部分字符,加别的字符构成新列

假设我要把对应列中的姓+’同学‘两个字符构成数据框的新列,可以在jupyter中运行如下语句:

date_frame.name.str[0:1] + '同学'

得到结果如下:

可以把上述结果用如下语句保存到原数据框中。

date_frame['new_name'] = date_frame.name.str[0:1] + '同学'

得到结果如下:

4 对数值型的列取四舍五入

假设我要对身高数值取四舍五入到小数点后一位,可以在jupyter中运行如下语句:

date_frame.height.round(1)

得到结果如下:

其中.height表示要取的列,.round(1)表示四舍五入保留1位小数,括号中的数表示要保留的小数位数。

特别的,如果括号里面的是负数,例如round(-1),表示四舍五入到10位,其它依此类推。

至此,在python中对数据框进行简单操作已经完成,大家可以动手练习一下,思考一下还有没有别的数据框操作的方法

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-11-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 阿黎逸阳的代码 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档