Python多进程

zhichengangle 2020-04-20

在Python中如果想创建多进程需要用到multiprrocessing中的Prrocess方法。

在进程之间全局变量是不共享的,如果要对进程的全局变量进行使用的话就需要用到multiprrocessing的Queue方法

首先我们先创建一个多进程

import time
from multiprocessing import Process
# 进程之间全局变量不共享


def work_1():
    for i in range(10):
        print(‘任务1‘)
        time.sleep(0.5)


def work_2():
    for i in range(10):
        print(‘任务2‘)
        time.sleep(0.5)


# 进程执行的时候不加main 为什么会报错:
# 在执行过程中相当于在另外一个py文件中导入这个模块并运行函数,由于是导入模块所以
# 创建多进程的代码也会被导入,然后就又去开了线程,陷入无限递归的状态
if __name__ == ‘__main__‘:
    # 创建两个进程
    p1 = Process(target=work_1)
    p2 = Process(target=work_2)
    p1.start()
    p2.start()

看过我之前写的关于线程的那么上面这段代码一定可以看懂,如果不明白可以回去看看关于线程的。

我们在多进程之间通讯需要用到队列,但是这个队列不是Queue.queue() 而是multiprrocessing中的Queue

queue.Queue 是进程内非阻塞队列

multiprocessing.Queue 是跨进程通信队列

import requestsfrom multiprocessing import Process, Queue
def work_1(q):
    while q.qsize() > 0:
        url = q.get()
        requests.get(url)
        print(‘任务1‘)


def work_2(q):
    while q.qsize() > 0:
        url = q.get()
        requests.get(url)
        print(‘任务2‘)


if __name__ == ‘__main__‘:
    q = Queue()
    for i in range(10):
        q.put(‘http://localhost:3000/login‘)
# 将q 这个实例化对象当作参数传入函数中(不同的进程中),可以实现多进程共享变量,把这个队列放到一个公共区间内
    p1 = Process(target=work_1, args=(q,))
    p2 = Process(target=work_2, args=(q,))
    p1.start()
    p2.start()

下面来聊一聊进程池:

Pool可以提供指定数量的进程供用户调用,当有新的请求提交到pool中时,如果池还没有满,那么就会创建一个新的进程用来执行该请求;但如果池中的进程数已经达到规定最大值,那么该请求就会等待,直到池中有进程结束,才会创建新的进程来它。

import requestsfrom multiprocessing import Pool, Manager  # 进程池Pool    Manager().Queue()  # 进程池中的队列import timeimport os  # 查看进程的pid# a = Manager().Queue()  # 进程池中的队列def work(q):    # 判断队列是否有任务    while q.qsize() > 0:        # 获取任务        url = q.get()        requests.get(url)        print(‘任务1{}‘.format(os.getpid()))if __name__ == ‘__main__‘:    # 进程池中的队列    q = Manager().Queue()    for i in range(10):        # 增加任务        q.put(‘http://localhost:3000/login‘)    # 创建进程池 最大进程数为3    p = Pool(3)    for i in range(10):         # 开启进程执行任务  在进程池中,初始化几个进程,轮询执行任务,当一个任务执行完毕后这个进程会去执行另一个任务,直到所有任务完成        if q.qsize() > 0:        # 每次循环将会用空闲出来的子进程去调用目标            p.apply_async(work, args=(q,))  # 异步的效率,也就是池中的进程一次性都去执行任务. 进程中有3个进程,一下就处理3个任务,接下来哪个进程处理完任务了,就马上去接收下一个任务    p.close()  # 进程池使用完毕一定要关闭进程池:停止往进程池中添加新的任务    p.join()  # 等待po中所有子进程执行完成,必须在close之后  等待线程池中的所有任务都执行完了之后再往下执行# 异步处理任务时 : 必须要加上close和join. 进程池的所有进程都是守护进程(主进程代码执行结束,守护进程就结束). 

相关推荐