学习
实践
活动
工具
TVP
写文章

Python小伙抓取汽车之家,做自驾游最强攻略!

小编在浏览汽车之家的时候,发现一个很好玩的地方,就是里面的“旅行家”板块,为什么说好玩呢,因为这里是各个车主分享的自己的自驾游的游记,特别的精彩,正好小编也有做自驾游的想法,那就来爬一波吧╮(╯╰)╭

具体过程呢,小编也不细说了,大致有几个点要注意:

1、汽车之家网页可以用json模块直接抓取

2、保存本地时,因为存在文本和图片的形式,所以小编使用了python-docx模块,没有的小伙伴需要安装下哦,方法如下:

进入cmd命令输入:pip install python-docx

3、图片不在本地不好往word里面写,就先保存本地,然后在读取本地文件写入,这里小编觉得可以优化下。

4、同样的,因为保存文件,所有借鉴网友的一小段函数,防止文件名出错而整个程序出错。

5、小编抓取的是“精彩游记”板块,但是没有去抓详细内容,只抓了游记和推荐图片以及详细内容的url等等,适合选择好以后再仔细观看。

好了,不啰嗦了,直接上代码和成果哦!

写的不好,欢迎大家指正!喜欢就关注一波呗!( ̄ε  ̄)

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180207A0QZEO00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券