首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

利用Python进行数据分析(六)之pandas基本功能续

排序和排名

.按索引排序

obj.sortindex() frame.sortindex()

DataFrame也可以指明具体的哪个轴frame.sort_index(axis=1)则为按照columns索引排序。

默认为升序,降序则添加参数ascending=False

.按值排序

缺失值默认放末尾。

obj.sortvalues()(作者写的是obj.order()但是最新的pandas已经没有使用了)frame.sortvalues(by=['a','b'])

(同样作者写的是frame.sortindex(by=['a','b'])但是最新的pandas已经没有使用了,并且会提示你使用sortvalues())

.排名

顾名思义 排名嘛,按照值的出现顺序从1开始排名,有相同的时取平均数比如45相同则4.5,678相同则均为7这样的形式。

当然,你可能排名的时候只是想显示12345连续的,相同的时候按照他的出现顺序,则可以使用method='first'。可选min,max即分别为相同值的最小顺序或者最大顺序,'average'默认:在相等分组中,为各个值分配平均排名。

降序只要添加参数ascending=False。

.带有重复值的轴索引

什么意思呢,就是具有相同的索引,这个也是允许存在的,

.总结

pandas的基本功能通过这两节就看完了,主要介绍的是Series和Dataframe两种数据结构的重建索引reindex,通过drop来删除某些索引,obj['b','c']选取时bc索引是都包含的,DataFrame的行上标签索引通过ix来实现,不用时选择出来的是列!不同索引的pandas之间进行算术运算,以及对其函数级操作,这章节我们对其排序排名,以及带过的描述了下有重复索引的时候。总的来说,基本的简单使用在这两节都有描述,可以根据我上面描述的回顾一下。不清楚再翻回去看看~

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180102G0VR2C00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券