DataFrame的数据处理(Pandas读书笔记6)

本期和大家分享DataFrame数据的处理~

一、提取想要的列

第一种方法就是使用方法,略绕,使用.列名的方法可以提取对应的列!

第二张方法类似列表中提取元素!本方法是我们将来比较常用的方法。

需要说明的是在提取列后 dtype:int64这里的类型指的该列的存储形式,那本身提取出来的数据是什么呢?

我们提取出来的这一列就是Series。所以DataFrame可以看做是Series的集合,而提取出任意的列就是Series。

二、提取想要的行

DataFrame有个特性就是可以任意进行行列处理,那如何提取某行呢?

要利用ix方法,但是实际工作中按照序号提取数据很少,更多是获取筛选后的行。筛选功能后期会分享到。在这里分享另外两个经常用到的,提取前几行后几行的方法。

.head()可以提取整个表的任意前多少行

.tail()可以提取整个表的任意后多少行

如果在括号内不输入参数,则默认返回五行。

针对行的问题,暂时先介绍到这里,后续会再次分享到。

三、DataFrame的赋值

当我们先创建的DataFrame列数大于原始数据的时候,就会以NaN方式显示,这个上期已经介绍过,当我们对某一列进行赋值的时候,整个列会赋值给一个相同的值。

如果我们直接对某个不存在的列进行赋值,pandas同样会默认帮我们创建好新的列,然后将对应的值存进去。

四、DataFrame的转置

对象.T方法可以将DataFrame进行转置,这里需要说明,该方法并不改变原数据的存储,如果想改变原数据需要重新赋值一次!

原文发布于微信公众号 - 阿凯的Excel(akexcel)

原文发表时间:2018-02-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

扫码关注云+社区