首页
学习
活动
专区
圈层
工具
发布
30 篇文章
1
七、Selenium与phantomJS----------动态页面模拟点击、网站模拟登录 每天一个小实例1(动态页面模拟点击,并爬取你想搜索的职位信息) 每天一个小实例2(模拟网站登录)我用的是
2
一、scrapy的下载安装---Windows(安装软件太让我伤心了) 总的来说:
3
一、Mysql(1)
4
二、Mysq(二)
5
一、HTML
6
六、BeautifulSoup4------自动登录网站(手动版)
7
五、XML与xpath--------------爬取美女图片 先用一个小实例开头吧(爬取贴吧每个帖子的图片)XML 和 HTML 的区别XML文档示例
8
数据结构与算法(一)
9
四、正则表达式re模块 常用的匹配规则:Python 的 re 模块也可以直接用re.match(),re.search(),re.findall(),re.finditer(),re.sub()
10
数据结构与算法(二)
11
一、Django的基本用法
12
二、Python介绍
13
三、Requests库的使用
14
四、类与对象(二)
15
五、常用模块
16
六、面向对象进阶
17
八、多线程爬虫(先占个位置,等整理好线程,进程,协程,异步IO在来写)
18
九、Python+Selenium模拟登录
19
二、urllib进阶
20
十、Python练习----基础搭建飞机大战
21
三、文件的操作、函数、类和对象
22
三、模型(一)
23
三、scrapy后续 LinkExtractorsrules Logging发送POST请求内置设置参考手册
24
二、路由、模板
25
九、Python发送QQ邮件(SMTP)
26
十、豆瓣读书爬虫
27
十一、模拟扫码登录微信(用Django简单的布置了下页面)发送接收消息 url.py templates views.py(逻辑层)
28
四、其它(一)ModelAdmin对象InlineModelAdmin对象重写admin模板Paginator对象Page对象示例
29
一、Vuforia_AR
30
一、事件函数的执行顺序(脚本的生命周期)

八、多线程爬虫(先占个位置,等整理好线程,进程,协程,异步IO在来写)

计算机的核心是CPU,CPU承担了所有的计算任务。

一个CPU核心,一次只能执行一个任务; 多个CPU核心同时可以执行多个任务。

一个CPU一次只能执行一个进程,其他进程处于非运行状态。

进程里包含的执行单元叫线程; 一个进程可以包含多个线程。

一个进程的内存空间是共享的,每个进程里的线程都可以使用这个内存空间;一个进程在使用这个共享时,其他线程必须等它结束。

 python里的lock

Queue(队列对象)

Queue是python中的标准库,可以直接import Queue引用;队列是线程间最常用的交换数据的形式

python下多线程的思考

对于资源,加锁是个重要的环节。因为python原生的list,dict等,都是not thread safe的。而Queue,是线程安全的,因此在满足使用条件下,建议使用队列

  1. 初始化: class Queue.Queue(maxsize) FIFO 先进先出
  2. 包中的常用方法:
    • Queue.qsize() 返回队列的大小
    • Queue.empty() 如果队列为空,返回True,反之False
    • Queue.full() 如果队列满了,返回True,反之False
    • Queue.full 与 maxsize 大小对应
    • Queue.get([block[, timeout]])获取队列,timeout等待时间
  3. 创建一个“队列”对象
    • import Queue
    • myqueue = Queue.Queue(maxsize = 10)
  4. 将一个值放入队列中
    • myqueue.put(10)
  5. 将一个值从队列中取出
    • myqueue.get()
下一篇
举报
领券