导语
随便爬点数据玩玩T_T利用Python爬取并简单分析爱淘宝网商品数据。让我们愉快地开始吧~
开发工具
Python版本:3.6.4相关模块:numpy模块;seaborn模块;requests模块;pyecharts模块;pandas模块;matplotlib模块;wordcloud模块;scipy模块;以及一些Python自带的模块。
环境搭建
安装Python并添加到环境变量,pip安装需要的相关模块即可。
数据爬取
我们想要爬取的是爱淘宝网搜索某一关键字后出现的所有商品信息数据:
测试之后发现请求:
https://ai.taobao.com/search/getItem.htm
并添加关键字和页码数据就可以获取对应的商品信息数据了。于是我们就可以愉快地写代码了:
在cmd窗口运行aiTaobao.py文件测试一下:
爬取结果保存在data.pkl文件中。
结语
这就是本文的全部的内容啦,是不是很想去尝试一下呢?小编已经把源码打包好啦,加扣裙:前面,九四三 中间 七五二 后面 三七一 就可以获取源码哦!
领取专属 10元无门槛券
私享最新 技术干货