数据分析的大综收尾总结

拼命的时候真的很狼狈,但是靠自己的样子真的很美!

2018 · 10 · 北京

数据分析

综合应用

欢度国庆

一、字符串离散化案例

具体可以参看的github上的代码

欢度国庆

二、数据合并join(行),merge(列)

join默认情况下他是把行索引相同的数据合并到一起

merge inner(默认,交集)

merge outer (并集)

merge left

merge right

练习刚刚我们学会了数据分合并,那么接下来,我们按照电影分类(genre)信息把数据呈现出来

欢度国庆

三、数据分组聚合

欢度国庆

四、数据分组聚合

常用函数

欢度国庆

五、数据的复合索引

简单的索引操作:

获取index

指定index

重新设置index

指定某一列作为index,drop的false是把Country这一列删除

返回index的唯一值

注意:index是一个可迭代的对象

欢度国庆

六、Series复合索引

Series的复合索引取值,直接在括号中写索引就可以了

欢度国庆

七、DataFrame复合索引

案例:

使用matplotlib呈现出店铺总数排名前10的国家

使用matplotlib呈现出每个中国每个城市的店铺数量

现在我们有全球排名靠前的10000本书的数据,那么请统计一下下面几个问题:

1.不同年份书的数量

2.不同年份书的平均评分情况

热烈庆祝建国69周年

国庆节快乐

  • 发表于:
  • 原文链接:https://kuaibao.qq.com/s/20181001G1KR4O00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券