前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python小伙自制模板之家查询和下载文件的脚本

python小伙自制模板之家查询和下载文件的脚本

作者头像
云飞
发布2018-09-13 16:53:17
7380
发布2018-09-13 16:53:17
举报
文章被收录于专栏:云飞学编程

通过python的requests和lxml库,完成对模板之家免费模板的查询和下载功能(保存本地)

目标网站: www.cssmoban.com

工具:python3.6 requesst、lxml库

以上2个库都可以通过pip安装,在cmd下输入命令:pip install requests(lxml),然后等待安装完成即可(如果报错,也可以网上搜索whl文件,下载到本地安装)

整体思路:

@查找目标网站的分类和相应的url,写入字典待查

@等待用户输入查询分类,返回对应的url

@找到分类的最大页码,做入循环

@找到每个模板url,进入后查找下载地址url

@ 建立用户输入分类文件夹,保存模版至文件夹

大致如此,接下来我们分析网页

入口页面:www.cssmoban.com

最大页码查找

下载地址所在

分类函数,传入名字,返回url:

完整代码和运行结果如下(头部信息请自行输入):

最后

这个网站很简单,不需要登录验证码,不需要cookies,爬虫也没有写的太暴力,注意加上间隔时间,别对人家服务器造成压力最好。

喜欢就关注下呗!喜欢和需要源码的小伙伴可以私信我,回复"资料"就可以哦!

或者点击链接加入群【python┮】:https://jq.qq.com/?_wv=1027&k=59NCLH6

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-02-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 云飞学python 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
验证码
腾讯云新一代行为验证码(Captcha),基于十道安全栅栏, 为网页、App、小程序开发者打造立体、全面的人机验证。最大程度保护注册登录、活动秒杀、点赞发帖、数据保护等各大场景下业务安全的同时,提供更精细化的用户体验。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档