DataFrame的数据处理

本期和大家分享DataFrame数据的处理~

一、提取想要的列

第一种方法就是使用方法,略绕,使用.列名的方法可以提取对应的列!

第二张方法类似列表中提取元素!本方法是我们将来比较常用的方法。

需要说明的是在提取列后dtype:int64这里的类型指的该列的存储形式,那本身提取出来的数据是什么呢?

我们提取出来的这一列就是Series。所以DataFrame可以看做是Series的集合,而提取出任意的列就是Series。

二、提取想要的行

DataFrame有个特性就是可以任意进行行列处理,那如何提取某行呢?

要利用ix方法,但是实际工作中按照序号提取数据很少,更多是获取筛选后的行。筛选功能后期会分享到。在这里分享另外两个经常用到的,提取前几行后几行的方法。

.head()可以提取整个表的任意前多少行

.tail()可以提取整个表的任意后多少行

如果在括号内不输入参数,则默认返回五行。

针对行的问题,暂时先介绍到这里,后续会再次分享到。

三、DataFrame的赋值

当我们先创建的DataFrame列数大于原始数据的时候,就会以NaN方式显示,这个上期已经介绍过,当我们对某一列进行赋值的时候,整个列会赋值给一个相同的值。

如果我们直接对某个不存在的列进行赋值,pandas同样会默认帮我们创建好新的列,然后将对应的值存进去。

四、DataFrame的转置

对象.T方法可以将DataFrame进行转置,这里需要说明,该方法并不改变原数据的存储,如果想改变原数据需要重新赋值一次!

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180206B05QXK00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券