Chinaunix首页 | 论坛 | 博客
  • 博客访问: 373881
  • 博文数量: 150
  • 博客积分: 3423
  • 博客等级: 中校
  • 技术积分: 1005
  • 用 户 组: 普通用户
  • 注册时间: 2011-07-15 09:04
文章分类

全部博文(150)

文章存档

2012年(2)

2011年(148)

分类:

2011-12-22 15:33:05

      在利用Python进行系统管理的时候,特别是同时操作多个文件目录,或者远程控制多台主机,并行操作可以节约大量的时间。当被操作对象数目不大时,可以直接利用multiprocessing中的Process动态成生多个进程,10几个还好,但如果是上百个,上千个目标,手动的去限制进程数量却又太过繁琐,这时候进程池Pool发挥作用的时候就到了。
      Pool可以提供指定数量的进程,供用户调用,当有新的请求提交到pool中时,如果池还没有满,那么就会创建一个新的进程用来执行该请求;但如果池中的进程数已经达到规定最大值,那么该请求就会等待,直到池中有进程结束,才会创建新的进程来它。这里有一个简单的例子:

  1. #!/usr/bin/env python
  2. #coding=utf-8
  3. """
  4. Author: Squall
  5. Last modified: 2011-10-18 16:50
  6. Filename: pool.py
  7. Description: a simple sample for pool class
  8. """

  9. from multiprocessing import Pool
  10. from time import sleep

  1. def f(x):
  2.     for i in range(10):
  3.         print '%s --- %s ' % (i, x)
  4.         sleep(1)


  5. def main():
  6.     pool = Pool(processes=3)    # set the processes max number 3
  7.     for i in range(11,20):
  8.         result = pool.apply_async(f, (i,))
  9.     pool.close()
  10.     pool.join()
  11.     if result.successful():
  12.         print 'successful'


  13. if __name__ == "__main__":
  14.     main()
       先创建容量为3的进程池,然后将f(i)依次传递给它,运行脚本后利用ps aux | grep pool.py查看进程情况,会发现最多只会有三个进程执行。pool.apply_async()用来向进程池提交目标请求,pool.join()是用来等待进程池中的worker进程执行完毕,防止主进程在worker进程结束前结束。但必pool.join()必须使用在pool.close()或者pool.terminate()之后。其中close()跟terminate()的区别在于close()会等待池中的worker进程执行结束再关闭pool,而terminate()则是直接关闭。result.successful()表示整个调用执行的状态,如果还有worker没有执行完,则会抛出AssertionError异常。
   
利用multiprocessing下的Pool可以很方便的同时自动处理几百或者上千个并行操作,脚本的复杂性也大大降低。
                本文章来至懒人的世界http://sysadm.blog.chinaunix.net),版权所有,如需转载,请注明出处
阅读(4020) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~