最近用python爬取了某东上的x款bra的用户评论,然后进行了size、color分析,直接上图:
从图表上分析初步得出该款bra黑色较受欢迎,购买的小姐姐size 75B最多~ 下面通过数据爬取、数据解析、图表分析三方面分析。
数据爬取
由于调用requesturl获取的数据不是json格式,所以上面使用了正则截取需要的json文本,然后把得的数据写入本地磁盘文件,在sublimetext3中打开brajindong.json文本,由于写入的文本有一定的格式,所以稍作处理就是一个格式规范的json啦
数据解析
以上已经得到数据,但是需要对bra的size、color进行统计,所以不得不对数据进行处理了,下面直接通过代码分析:
使用python内置模块operator、itertools可以很好的对数据进行分组统计,以上对大小、颜色统计的输出结果分别为:
图表分析
以上已经得到具体数据,下面使用echarts通过图片的方式直观的展示。使用echarts也非常简单,到其官网上下载js文件引入即可。具体代码如下:
为了方便使用,利用nginx搭建了web服务指向本地html、js静态资源,在浏览器中输入 即可得出文章开始的图表。笔者是一名python小白,有任何问题和建议欢迎随时交流,下面是我的wechat
领取专属 10元无门槛券
私享最新 技术干货