首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

利用Python做数据分析——10分钟入门Pandas(二)

你怀念昨天或期待明天,或是任何还呼吸还生存的每个最好的今天

——阿信

原创文章,转载请注明来源。

本文开头先安利一下五月天的《自传》,这张专辑里面有13首歌,其中11首进入了我的虾米年度歌单。听着这张专辑,就好像听着自己的故事一般。

由于本人近期在部门内做关于Python的分享,打算将分享的内容也同步到这个公总号中,因此在利用Excel做数据挖掘系列文章中会穿插一些与Python相关的内容。

Pandas 是一个非常好用的库,正如名字一样,人见人爱。之所以如此,就在于不论是读取、处理数据,用它都非常简单。(PC端阅读效果更佳)

上节内容中主要讲解了一下Pandas的两种数据结构Series和DataFrame的基本特征,以及如何利用Pandas对常用格式的数据进行导入和导出。

本节中,我将介绍一下Series和DataFrame相关的一些基本操作。

小结

关于Pandas模块的话题非常丰富,每个人使用Pandas的场景也各不一样。因为我打算以数据分析师的角度,带领大家迅速的了解这个库。

本期内容中,我们讲解了数据分析师常用到的一些关于Series和DataFrame的操作,主要包含以下6个内容:

一、重新索引与填充;

二、数据清洗(包含丢弃部分轴数据、处理none值和替换);

三、选取和过滤数据(Pandas在实际应用中最重要的环节);

四、函数应用和映射;

五、排序和排名;

六、处理重复值的方法。

本以为分两次能讲完Pandas模块的常用功能,但是这个模块的功能真是包罗万象,而且这些功能在数据分析中都特别实用。可能还需要一期的内容来结束这个模块的入门教程,感兴趣的小朋友敬请期待哦!

如过觉得这些内容对您有用,请点赞分享给更多的朋友吧,谢谢!

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180117G08UKL00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券