python小白爬取某东bra数据分析

最近用python爬取了某东上的x款bra的用户评论,然后进行了size、color分析,直接上图:

从图表上分析初步得出该款bra黑色较受欢迎,购买的小姐姐size 75B最多~ 下面通过数据爬取、数据解析、图表分析三方面分析。

数据爬取

由于调用requesturl获取的数据不是json格式,所以上面使用了正则截取需要的json文本,然后把得的数据写入本地磁盘文件,在sublimetext3中打开brajindong.json文本,由于写入的文本有一定的格式,所以稍作处理就是一个格式规范的json啦

数据解析

以上已经得到数据,但是需要对bra的size、color进行统计,所以不得不对数据进行处理了,下面直接通过代码分析:

使用python内置模块operator、itertools可以很好的对数据进行分组统计,以上对大小、颜色统计的输出结果分别为:

图表分析

以上已经得到具体数据,下面使用echarts通过图片的方式直观的展示。使用echarts也非常简单,到其官网上下载js文件引入即可。具体代码如下:

为了方便使用,利用nginx搭建了web服务指向本地html、js静态资源,在浏览器中输入 即可得出文章开始的图表。笔者是一名python小白,有任何问题和建议欢迎随时交流,下面是我的wechat

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190111G01KI200?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券

玩转腾讯云 有奖征文活动