首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

多线程爬取斗图网站,赶紧上车

的属性 onerror的内容(至于为什么不是img下的src,大家可以访问地址试下) onerror属性 img的src地址 其次:爬取思路(关键) 在第一步分析网站准备工作之后,我们思考下:怎么实现多页爬取...属性内容 图片所在div 获取onerror内容 这里解释下这段代码:一页中有10个套图,然后每个套图中有9个图片,所以我们在这里获得的items有90个(图片所在的div),然后我们在每一个items...中获取onerror里的内容,以便(4)步中的start_save_img()调用 (4)利用正则获取onerror内容里的图片src地址,然后用多线程实现下载图片 多线程下载图片 首先解释下 start_save_img...(imgurl_list):参数 imgurl_list是我们(3)中获得onerror的内容(注意:不是图片的src地址,我们还要用注册和切片处理下)。...其中我们在for循环中创建一个线程,调用的方法是save_img,传递的参数是onerror save_img(img_url):接到onerror,用正则和切片处理后获得到每个图片的src地址,最后保存到本地

681100

Python爬虫系列(三)多线程爬取斗图网站(皮皮虾,我们上车)

的属性 onerror的内容(至于为什么不是img下的src,大家可以访问地址试下) onerror属性 img的src地址 其次:爬取思路(关键) 在第一步分析网站准备工作之后,我们思考下:怎么实现多页爬取...属性内容 图片所在div 获取onerror内容 这里解释下这段代码:一页中有10个套图,然后每个套图中有9个图片,所以我们在这里获得的items有90个(图片所在的div),然后我们在每一个items...中获取onerror里的内容,以便(4)步中的start_save_img()调用 (4)利用正则获取onerror内容里的图片src地址,然后用多线程实现下载图片 多线程下载图片 首先解释下 start_save_img...(imgurl_list):参数 imgurl_list是我们(3)中获得onerror的内容(注意:不是图片的src地址,我们还要用注册和切片处理下)。...其中我们在for循环中创建一个线程,调用的方法是save_img,传递的参数是onerror save_img(img_url):接到onerror,用正则和切片处理后获得到每个图片的src地址,最后保存到本地

1.3K60
领券