突然在网上看见自己喜欢的图片,想下载,只能一张图片一张图片的点击,想一想,你要下载的图片有10000张,那会是一个怎么样的画面,答案很简单,你会哭的,假如一张图片从搜索出来,到点击放大,再到下载,假如以最快速度,中间不间断,那我们来算一下时间,
简单的一套下来,除去搜索,最简单的步骤是4步,每一步算1秒钟,4秒,那就是40000秒,也就是11.1个小时,等下完这些图片,估计已经吐血了,那好,我们在来增加步骤,加上搜索,加上修改名称,网络问题不考虑,那就是6步,6万秒,只是多了两步,却是多了5个多小时,想想那是多痛苦的事。
下面,是传受你武功秘籍的时候了,只要掌握五个步骤,下载分分钟钟的事,还等什么,直接上代码:
import requests#导入两个模块
import re
url.encoding="utf-8"#编码格式,根据情况指定
url_text=url.text#获取到网页内容
extract=r''#正则表达式
img_url=re.findall(extract,url_text)#根据正则表达式提取url
print(img_url)#这里可以打印看一下。
然后一个爬虫就完成了,至于后面的操作都是根据这个重复操作得到的,就不一一叙述。
关注公众号,后台输入:“爬虫教程” 获取整套的爬虫视频链接。
领取 专属20元代金券
Get大咖技术交流圈