前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >十、python学习笔记-协程-协程爬虫(对比协程和非协程效率)

十、python学习笔记-协程-协程爬虫(对比协程和非协程效率)

原创
作者头像
堕落飞鸟
发布2022-02-10 08:43:17
7730
发布2022-02-10 08:43:17
举报
文章被收录于专栏:飞鸟的专栏
代码语言:javascript
复制
# 一个简单的小爬虫,将3个页面的数据保存到data.html,对比协程和非协程的使用时间
"""协程
1、通过urlopen获取数据
2、写入文件
3、使用三个页面,通过gevent.joinal执行(协程会在IO阻塞处切换),用时短
4、在Windows系统,由于捕获IO较慢。使用monkey.patch_all(),加快IO捕获,Linux系统不存在此问题
"""

from urllib.request import urlopen
import gevent
from gevent import monkey
import time

monkey.patch_all()


def foo(url):
    print('GET:{}'.format(url))
    resp = urlopen(url)
    data = resp.read()

    with open('data.html', 'wb') as f:
        f.write(data)
    print('{} bytes received from {}'.format(len(data), url))


url_list = ['https://www.python.org/', 'https://github.com/', 'http://www.yahoo.com/']

start_time = time.time()
gevent.joinall([gevent.spawn(foo, 'https://www.python.org/'),
                gevent.spawn(foo, 'https://github.com/'),
                gevent.spawn(foo, 'http://www.yahoo.com/')])
end_time = time.time() - start_time
print(end_time)

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档