首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

python小例子-电影评分

这是在学习《利用python进行数据分析》这本书的时候遇到的小例子,包含了几个pandas常用的函数,斑点鱼觉得还不错~可以带你很容易的走入pandas库。

数据源:http://www.grouplens.org/node/73

首先第一步,最重要的一步,之前普及python准备工作的时候也提到过,那就是——更改当前工作目录!

接着,导入pandas库

这时才开始正式干的第一件事:读取数据,生成DataFrame对象

然后,合并三个表格

紧接着,计算电影的平均得分(用pivot_table函数)

然后,过滤掉评分不够250条的电影

再进一步,了解女性观众最喜欢的电影,对F列进行排序(sort_index)

然后更深入一点,计算男女观众评分分歧

最后,找出分歧最大的电影,计算得分数据的方差或标准差(std)

这里值得注意的是,如果一组数是个Series,它排序就用order(),而dataframe则一般用sort_index().

一起学习的小伙伴如果有什么想法或者意见,欢迎沟通~

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180123G0OM7S00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券