前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用 Python 实现的线程池

用 Python 实现的线程池

作者头像
py3study
发布2020-01-14 16:38:03
6690
发布2020-01-14 16:38:03
举报
文章被收录于专栏:python3

为了提高程序的效率,经常要用到多线程,尤其是IO等需要等待外部响应的部分。线程的创建、销毁和调度本身是有代价的,如果一个线程的任务相对简单,那这些时间和空间开销就不容忽视了,此时用线程池就是更好的选择,即创建一些线程然后反复利用它们,而不是在完成单个任务后就结束。

下面是用Python实现的通用的线程池代码:

view plainprint?

  1. import Queuethreadingsys
  2. from threading import Thread  
  3. import time,urllib
  4. # working thread
  5. class Worker(Thread):  
  6.     worker_count = 0  
  7. def __init__( self, workQueue, resultQueue, timeout = 0, **kwds):  
  8.         Thread.__init__( self, **kwds )  
  9. self.id = Worker.worker_count  
  10.         Worker.worker_count += 1  
  11. self.setDaemon( True )  
  12. self.workQueue = workQueue  
  13. self.resultQueue = resultQueue  
  14. self.timeout = timeout  
  15. def run( self ):  
  16. ''' the get-some-work, do-some-work main loop of worker threads '''
  17. while True:  
  18. try:  
  19. callable, args, kwds = self.workQueue.get(timeout=self.timeout)  
  20.                 res = callable(*args, **kwds)  
  21. print "worker[%2d]: %s" % (self.id, str(res) )  
  22. self.resultQueue.put( res )  
  23. except Queue.Empty:  
  24. break
  25. except :  
  26. print 'worker[%2d]' % self.id, sys.exc_info()[:2]  
  27. class WorkerManager:  
  28. def __init__( self, num_of_workers=10, timeout = 1):  
  29. self.workQueue = Queue.Queue()  
  30. self.resultQueue = Queue.Queue()  
  31. self.workers = []  
  32. self.timeout = timeout  
  33. self._recruitThreads( num_of_workers )  
  34. def _recruitThreads( self, num_of_workers ):  
  35. for i in range( num_of_workers ):  
  36.             worker = Worker( self.workQueue, self.resultQueue, self.timeout )  
  37. self.workers.append(worker)  
  38. def start(self):  
  39. for w in self.workers:  
  40.             w.start()  
  41. def wait_for_complete( self):  
  42. # ...then, wait for each of them to terminate:
  43. while len(self.workers):  
  44.             worker = self.workers.pop()  
  45.             worker.join( )  
  46. if worker.isAlive() and not self.workQueue.empty():  
  47. self.workers.append( worker )  
  48. print "All jobs are are completed."  
  49. def add_job( self, callable, *args, **kwds ):  
  50. self.workQueue.put( (callable, args, kwds) )  
  51. def get_result( self, *args, **kwds ):  
  52. return self.resultQueue.get( *args, **kwds )  

Worker类是一个工作线程,不断地从workQueue队列中获取需要执行的任务,执行之,并将结果写入到resultQueue中,这里的workQueue和resultQueue都是现成安全的,其内部对各个线程的操作做了互斥。当从workQueue中获取任务超时,则线程结束。

WorkerManager负责初始化Worker线程,提供将任务加入队列和获取结果的接口,并能等待所有任务完成。

一个典型的测试例子如下,它用10个线程去下载一个固定页面的内容,实际应用时应该是执行不同的任务。

view plainprint?

  1. def test_job(id, sleep = 0.001 ):  
  2. try:  
  3. urllib.urlopen('https://www.gmail.com/').read()  
  4. except:  
  5. print '[%4d]' % id, sys.exc_info()[:2]  
  6. return id
  7. def test():  
  8. import socket
  9. socket.setdefaulttimeout(10)  
  10. print 'start testing'  
  11.     wm = WorkerManager(10)  
  12. for i in range(500):  
  13.         wm.add_job( test_job, i, i*0.001 )  
  14.     wm.start()  
  15.     wm.wait_for_complete()  
  16. print 'end testing' 
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/07/06 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档