问题描述:
Python程序中,由于GIL(Global Interpreter Lock,全局解释器锁)的原因,采用多线程编程并不能大幅度提高任务吞吐量。如果要充分利用硬件资源和大幅度提高任务吞吐量,需要使用多进程编程技术。
进程是正在执行中的应用程序,是操作系统进行资源分配的最小单位。一个进程是正在执行中的一个程序使用资源的总和,包括虚拟地址空间、代码、数据、对象句柄、环境变量和执行单元等等。一个应用程序同时打开并执行多次,就会创建多个进程。
Python标准库multiprocessing用来实现进程的创建与管理以及进程间的同步与数据交换,是支持并行处理的重要模块,其中创建、启动进程以及进程间同步的用法与threading中的线程类似。标准库multiprocessing同时支持本地并发与远程并发,有效避免了GIL问题,可以更有效地利用CPU资源,尤其适合多核或多CPU环境。
众所周知,Python程序在运行时有个特殊属性__name__,当在Python开发环境中或命令提示符中直接执行Python程序时,特殊属性__name__的值为'__main__'。当使用import语句导入Python程序作为模块使用时,特殊属性__name__的值为程序文件的名字。那么,特殊属性__name__还有别的取值吗?程序中if __name__ == '__main__'这样的判断和选择结构具体有什么作用呢?为什么多进程编程时程序中总是要加上这样一句呢?下面的演示代码解释了这个问题。
演示代码:
运行结果: