Python并发编程:多线程-GIL全局解释器锁

一 引子

在Cpython解释器中,同一个进程下开启的多线程,同一时刻只能有一个线程执行,无法利用多核优势首先:需要明确的一点是GIL并不是Python的特性,它是在实现Python解析器(CPython)时所引入的一个概念。就好比c++是一套语言(语法)标准,但是可以用不同的编译器来编译成可执行代码,
例如:GCC,INTEL C++,Visual C++等。Python也一样,同样一段代码可以通过CPython,PyPy,Psyco等不同的Python执行环境来执行。像其中的JPython就没有GIL。然而因为CPython是
大部分环境下默认的Python执行环境。所以很多人的概念里CPython就是Python,也就想当然的把GIL归结为Python语音的缺陷。所以这里要先明确一点:GIL并不是Python的特性,Python完全可
以不依赖与GIL

二 GIL介绍
  GIL本质就是一把互斥锁,既然是互斥锁,所有互斥锁的本质都一样,都是将并发运行变成串行,以此来控制同一时间内共享数据只能被一个任务所修改,进而保证数据安全。
可以肯定一点是:保护不同的数据的安全,就应该加不同的锁
要想了解GIL,首先确定一段,每次执行Python程序,就会产生一个独立的进程。例如Python test.py,python aaa.py,python bb.py 会产生3个不同的Python进程

验证Python test.py只会产生一个进程

1

2

3

4

import os

import time

print(os.getpid())

time.sleep(30)

 

1

2

3

4

5

6

7

8

#打开终端执行

python3 test.py

#在windows下查看

tasklist |findstr python

#在linux下下查看

ps aux |grep python

  在一个Python的进程内,不仅有test.py的主线程或者由该主线程开启的其它线程,还有解释器开启的垃圾回收等解释器级别的线程,总之,所有线程都运行在一个进程内

1

2

3

4

1、所有线程都是共享的,这其中,代码作为一种数据也是被所有线程共享的(test.py的所有代码以及CPython解释器的所有代码)

例如:test.py定义一个函数work(代码内容如下图),在进程内所有线程都能访问work的代码,于是我们可以开启三个线程然后target都指向该代码,能访问到意味着就是可以执行。

2、所有线程的任务,都需要将任务的代码当做参数传给解释器的代码去执行,即所有的线程要项运行自己的任务,首先需要解决的是能够访问到解释器的代码  

  综上:

如果多个线程的target=work,那么执行流程是:

多个线程先访问到解释器的代码,即拿到执行权限,然后将target的代码交给解释器的代码去执行

  解释器的代码是所有线程共享,所以垃圾回收线程也可能访问到解释器的代码而去执行,这就导致了一个问题:对于同一个数据100,可能线程1执行x=100的同时,而垃圾回收执行的是回收100的操作,解决这种问题没有声明高明的方法,就是加锁处理,如下图的GIL,保证Python解释器同一时间只能执行一个任务的代码

三 GIL与Lock 
  问题:Python已经有一个GIL来保证同一时间只能有一个线程来执行了,为什么这里还需要lock?
首先:我们需要达成共识:锁的目的是为了保护共享的数据,同一时间只能有一个线程来修改共享的数据

然后:我们可以得出结论:保护不同的数据就应该加不同的锁

最后:问题是很明朗了,GIL与LOCK是两把锁,保护的数据不一样,前者是解释器级别的(当然保护的就是解释器级别的数据,比如垃圾回收的数据),后者是保护用户自己开发的应用程序的数据,很明显GIL
负责这件事,只能用户自定义加锁处理,即Lock,如下图:

分析:

1

2

3

4

5

6

7

1100个线程去抢GIL锁,即抢执行权限

2、肯定有一个线程先抢到GIL(暂且称为线程1),然后开始执行,一旦执行就会拿到lock.acquire()

3、极有可能线程1还未执行完毕,就有另外一个线程2抢到GIL,然后开始运行,但线程2发现互斥锁lock还未被线程1释放,于是阻塞,被迫交出执行权限,即释放GIL

4、直到线程1重新抢到GIL,开始从上次暂停的位置继续执行,直到正常释放互斥锁lock,然后其它的线程再重复2,3,4的过程  

示例代码:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

from threading import Thread,Lock

import os

import time

def work():

    global n

    lock.acquire()

    temp = n

    time.sleep(0.5)

    = temp - 1

    lock.release()

if __name__ == '__main__':

    lock = Lock()

    = 100

    = []

    for in range(100):

        = Thread(target=work)

        l.append(p)

        p.start()

    for in l:

        p.join()

    print(n)    # 结果肯定为0,由原来的并发执行变成串行,牺牲了执行效率保证了数据安全,不加锁则结果可能为99

 

  四 GIL与多线程

有了GIL的存在,同一时刻同一进程中只有一个线程被执行

问题:进程可以利用多核,但是开销大,而Python的多线程开销小,但却无法利用多核优势,也就是说Python没用了,PHP才是最牛B的语言?

要解决这个问题,我们需要在几个点上达成一致:

1

2

3

4

5

1、CPU到底是用来做计算的,还是用来做I/O的?

2、多CPU,意味着可以有多个核并行完成计算,所以多核提升的是计算性能

3、每个CPU一旦遇到I/O阻塞,仍然需要等待,所以多核对I/O操作没什么用处

  一个工人相当于CPU,此时计算相当于工人在干活,I/O阻塞相当于为工人干活提供所需原材料的过程,工人干活的过程中如果没有原材料了,则工人干活的过程需要停止,直到原材料的到来

如果你的工厂的大多数任务需要有准备原材料的过程(I/O密集型),那么你有再多的工人,意义也不大,还不如一个人,在等材料的过程中让工人去干别的活

反过来讲,如果你的工厂原材料都齐全,那当然是工人越多,效率越高

结论:

1

2

3

1、对计算来说,CPU越多越好,但是对于I/O来说,再多的CPU也没用

2、当然对运行一个程序来说,随着CPU的增多执行效率肯定会有所提高(不管提高幅度多大,总会有所提高),这是因为一个程序基本上不会是纯计算或者纯I/O,所以我们只能相对的去看一个程序到底是计算密集型还是I/O密集型,从而进一步分享Python的多线程到底有无用武之地  

假设我们有四个任务需要处理,处理方式肯定是要玩出并发的效果,解决方案可以是:

1

2

3

方案一:开启四个进程

方案二:一个进程下,开启四个线程

 

单核情况下,分析结果:

1

2

如果四个任务是计算密集型,没有多核来并行计算,方案一徒增了创建进程的开销,方案二胜

如果四个任务是I/O密集型,再多的核也解决不了I/O问题,方案二胜

多核情况下,分析结果:

1

2

如果四个任务是计算密集型,多核意味着并行计算,在Python中一个进程中同一时刻只有一个线程执行用不上多核,方案一胜

如果四个任务是I/O密集型,再多的核也解决不了I/O问题,方案二胜  

结论:
现在计算机基本上都是多核,Python对于计算密集型的任务开多个线程的效率并不能带来多大性能上的提升,甚者不如串行(没有大量切换),但是,对于I/O密集型的任务效率还是有显著提升的

五  多线程性能测试


如果并发的多个任务是计算 密集型:多进程效率高

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

from multiprocessing import Process

from threading import Thread

import os,time

def work():

    res = 0

    for in range(10000):

        res *= i

if __name__ == '__main__':

    = []

    print(os.cpu_count())

    start = time.time()

    for in range(4):

        = Process(target=work)

        = Thread(target=work)

        l.append(p)

        p.start()

    for in l:

        p.join()

    stop = time.time()

    print('运行时间: %s' % (stop-start))

 

  如果并发的多个任务是I/O密集型:多线程效率高

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

from threading import Thread

import threading

import os,time

def work():

    time.sleep(2)

    print('===>')

if __name__ == '__main__':

    = []

    print(os.cpu_count())

    start = time.time()

    for in range(400):

        #p = Process(target=work)

        = Thread(target=work)     # 耗时2秒多

        l.append(p)

        p.start()

    for in l:

        p.join()

    stop = time.time()

    print('运行时间:%s' %(stop-start))

  

应用

1

2

多线程用于IO密集型,如socket,爬虫,web

多进程用于计算密集型,如金融分析

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/503364.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C语言 for 循环语句的基本格式是什么?

一、问题 for 循环语句在C语⾔中是最为常见的循环语句,其功能强⼤,⽽且⽤法灵活,那么它的基本格式是什么呢? 二、解答 for 语句的⼀般形式为: for(表达式1;表达式2;表达3)语句; 每条 for 语句包含三个⽤分…

0基础跨考计算机|408保姆级全年计划

我也是零基础备考408! 虽说是计算机专业,但是本科一学期学十几门,真的期末考试完脑子里什么都不进的...基本都是考前一周发疯学完水过考试...😅 想要零基础跨考可以直接从王道开始!跟教材一点一点啃完全没必要🥸 现在…

理解python3中的回调函数

百度百科说:回调函数就是一个通过函数指针调用的函数。如果你把函数的指针(地址)作为参数传递给另一个函数,当这个指针被用来调用其所指向的函数时,我们就说这是回调函数。回调函数不是由该函数的实现方直接调用&#…

协议(网络协议)

HTTP/HTTPS 协议 HTTP 实际上是个缩写,英文全称是:Hyper Text Transfer Protocol (超文本传输协议)。 最常用的网页(也叫web页)就是一种超文本的具体表现形式。HTTPS (全称:Hyper …

速看!深夜悄悄分享一个电力优化代码集合包!

代码集合包如下: 主从博弈的智能小区定价策略及电动汽车调度策略 碳交易机制下的综合能源优化调度 两阶段鲁棒优化算法的微网多电源容量配置 冷热电多能互补综合能源系统优化调度 考虑预测不确定性的综合能源调度优化 考虑柔性负荷的综合能源系统低碳经济优化调度 考…

回归预测 | Matlab实现BiTCN基于双向时间卷积网络的数据回归预测

回归预测 | Matlab实现BiTCN基于双向时间卷积网络的数据回归预测 目录 回归预测 | Matlab实现BiTCN基于双向时间卷积网络的数据回归预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.Matlab实现BiTCN基于双向时间卷积网络的数据回归预测(完整源码和数据&a…

工作电压范围宽的国产音频限幅器D2761用于蓝牙音箱,输出噪声最大仅-90dBV

近年来随着相关技术的不断提升,音箱也逐渐从传统的音箱向智能音箱、无线音箱升级。同时在消费升级的背景下,智能音箱成为人们提升生活品质的方式之一。智能音箱是智能化和语音交互技术的产物,具有点歌、购物、控制智能家居设备等功能&#xf…

吴恩达机器学习笔记:第5周-9 神经网络的学习(Neural Networks: Learning)

目录 9.1 代价函数 9.1 代价函数 首先引入一些便于稍后讨论的新标记方法: 假设神经网络的训练样本有𝑚个,每个包含一组输入𝑥和一组输出信号𝑦,𝐿表示神经网络层数,𝑆&…

如何安装ProtoBuf环境

1 🍑下载 ProtoBuf🍑 下载 ProtoBuf 前⼀定要安装依赖库:autoconf automake libtool curl make g unzip 如未安装,安装命令如下: Ubuntu ⽤⼾选择: sudo apt-get install autoconf automake libtool cur…

数电实验之流水灯、序列发生器

最近又用到了数电实验设计的一些操作和设计思想,遂整理之。 广告流水灯 实验内容 用触发器、组合函数器件和门电路设计一个广告流水灯,该流水灯由 8 个 LED 组成,工作时始终为 1 暗 7 亮,且这一个暗灯循环右移。 1) 写出设计过…

SpringCloud-同步异步通讯比较

本文详细探讨了同步通讯和异步通讯在信息传递中的区别,以及它们分别带来的优势和不足。通过对支付流程的案例分析,突显了同步通讯可能面临的阻塞和服务依赖问题,而异步通讯通过引入事件驱动模式和消息代理(Broker)成功…

Web后端开发总结(黑马学习笔记)

我们来回顾一下关于web后端开发,我们都学习了哪些内容,以及每一块知识,具体是属于哪个框架的。 web后端开发现在基本上都是基于标准的三层架构进行开发的,在三层架构当中,Controller控制器层负责接收请求响应数据&…