(学习笔记-进程管理)线程

在早期的操作系统都是以进程为独立运行的基本单位,直到后面,计算机科学家们提出了更小的能独立运行的基本单位:线程


 

为什么使用线程?

举个例子,假设要编写一个视频播放软件,那么软件功能的核心模块有三个:

  • 从视频文件中读取数据
  • 对读取的数据进行解压缩
  • 把压缩后的视频数据播放出来

对于单进程的实现方式:

 对于单进程的这种方式,存在以下问题:

  • 播放出来的画面和声音会不连贯,因为当CPU能力不够强的时候, Read 的时候可能进程就等在这了,这样就会导致等半天才进行数据解压和播放
  • 各个函数之间不是并发执行,影响资源的使用效率

那改成多进程的方式:

 对于多进程的这种方式,依然会存在问题:

  • 进程之间如何通信,共享数据?
  • 维护进程的系统开销较大,如创建进程时,分配资源、建立PCB;终止进程时,回收资源、撤销PCB;进程切换时,保存当前进程的状态信息;

那到底如何解决呢?需要有一种新的实体,满足以下特性:

  • 实体之间可以并发运行
  • 实体之间共享相同的地址空间

这个新的实体,就是线程(Thread),线程之间可以并发运行且共享相同的地址空间。


什么是线程?

线程是进程当中的一条执行流程。

同一个进程内多个线程之间可以共享代码段、数据段、打开的文件等资源,但每个线程各自都有一套独立的寄存器和栈,这样可以确保线程的控制流是相对独立的。

 线程的优缺点?

线程的优点:

  • 一个进程中可以同时存在多个线程
  • 各个线程之间可以并发执行
  • 各个线程之间可以共享地址空间和文件等资源

线程的缺点:

  • 当进程中的一个线程崩溃时,会导致其所属进程的所有线程崩溃(这里针对C/C++语言)。

举个例子,对于游戏的用户设计,则不应该使用多线程的方式,否则一个用户挂了,会影响其他同个进程的线程。


线程和进程的比较

线程和进程的比较:

  • 进程是资源(包括内存、打开的文件等)分配的单位,线程是CPU调度的单位
  • 进程拥有一个完整的资源平台,而线程只独享必不可少的资源,如寄存器和栈
  • 线程同样具有就绪、阻塞、执行三种基本状态,同样具有状态之间的转换关系
  • 线程能减少并发执行的时间和空间开销

对于线程相比进程能减少开销,体现在:

  • 线程的创建时间比进程快,因为进程在创建的过程中还需要资源管理信息,比如内存管理信息、文件管理信息,而线程在创建的过程中,不会设计这些资源管理信息,而是共享它们
  • 线程的终止时间比进程快,因为线程释放的资源相比进程要小很多
  • 同一个进程内的线程切换比进程切换快,因为线程具有相同的地址空间(虚拟内存空间),这意味着同一个进程的线程都具有同一个页表,那么在切换的时候就不需要切换页表。而对于进程之间的切换,切换的时候要把页表给切换掉,而页表的切换过程开销是比较大的
  • 由于同一进程的各线程间共享内存和文件资源,那么在线程之间数据传递的时候,就不需要经过内核了,这就使得线程之间的数据交互效率更高了

所以不管是时间效率还是空间效率,线程都比进程高。


线程的上下文切换

在前面我们知道了进程与线程最大的区别在于:线程是调度的基本单位,而进程则是资源拥有的基本单位

所谓操作系统的任务调度,实际上的调度对象是线程,而进程只是给线程提供了虚拟内存、全局变量等资源。

对于线程和进程,可以理解为:

  • 当进程只有一个线程时,可以认为进程就等于线程
  • 当进程拥有多个线程时,这些线程会共享相同的虚拟内存和全局变量等资源,这些资源在上下文切换时是不需要修改的

另外,线程也有自己的私有数据,比如栈和寄存器等,这些在上下文切换的时候也是需要保存的。

线程上下文切换的是什么?

这还得看线程是不是属于同一个进程:

  • 当两个线程不是属于同一个进程,则切换的过程就跟进程上下文切换一样
  • 当两个线程属于同一个进程,因为虚拟内存是共享的,所以在切换时,虚拟内存这些资源就保持不动,只需要切换线程的私有数据、寄存器等不共享的数据

所以,线程的上下文切换要比进程开销小很多。


线程的实现

主要有三种线程的实现方式:

  • 用户线程:在用户空间实现的线程,不是由内核管理的线程,是由应用层面的线程库来完成线程的管理,对于用户线程的存在,内核无法感知。
  • 内核线程:在内核中实现的线程,是由内核管理的线程
  • 轻量级进程:在内核中来支持用户的线程

用户线程和内核线程的对应关系

首先,第一种关系是多对一的关系,也就是多个用户线程对应同一个内核线程:

 第二种是一对一的关系,也就是一个用户线程对应一个内核线程:

 第三种是多对多的关系,也就是多个用户线程对应到多个内核线程:

 用户线程如何理解?存在什么优势和缺陷?

用户线程是基于用户态的线程管理库来实现的,那么线程控制块(Thread Control Block, TCB)也是在库里面来实现的,对于操作系统而言是看不到这个TCB的,内核无法感知用户级线程的存在,它只能看到整个进程的PCB 。

所以,用户线程的整个线程管理和调度,操作系统是不直接参与的,而是由用户级线程库函数来完成线程的管理,包括线程的创建、终止、同步和调度等

用户级线程的模型,也就类似前面提到的多对一的关系,即多个用户线程对应同一个内核线程,如下图所示:

 用户线程的优点:

  • 每个进程都需要有它私有的线程控制块(TCB)列表,用来跟踪记录它各个线程状态信息(PC、栈指针、寄存器),TCB由用户级线程库函数来维护,可用于不支持线程技术的操作系统;
  • 用户线程的切换也是由线程库函数完成的,无需用户态和内核态的切换,所以速度特别快;

用户线程的缺点:

  • 由于操作系统不参与线程的调度,如果一个线程发起了系统调用而阻塞,那进程所包含的用户线程都不能执行了,无法做到真正意义上的并发
  • 当一个线程开始运行后,除非它主动交出CPU的使用权,否则它所在的进程当中的其他线程无法运行,因为用户态的线程没法打断当前运行中的线程,它没有这个特权,只有操作系统才有,但是用户线程不是由操作系统管理的
  • 内核资源的分配是根据进程分配的,用户级线程所在的进程可以竞争系统的资源,而每个用户线程只能竞争该进程内部的资源。对于一个进程,可能有成千上万个用户级线程,但是它们对系统的资源没有影响。

内核线程如何理解?存在什么优势和缺陷?

内核线程是由操作系统管理的,线程对应的TCB自然放在操作系统里,这样线程的创建、终止和管理都是操作系统负责

  • 内核级线程可以在全系统内进行资源的竞争
  • 内核空间内为每一个内核支持线程设置了一个线程控制块(TCB),内核根据该控制块,感知线程的存在,并进行控制。

内核线程的模型,也就是类似前面提到的一对一的关系,即一个用户线程对应一个内核线程,如下图所示:

内核线程的优点:

  • 在一个进程当中,如果某个内核线程发起系统调用而被阻塞,并不会影响其他内核线程的运行
  • 分配给线程,多线程的进程获得更多的CPU运行时间

内核线程的缺点:

  • 在支持内核线程的操作系统中,由内核来维护进程和线程的上下文信息,如PCB和TCB
  • 线程的创建、终止和切换都是通过系统调用的方式来进行,因此对于系统来说,系统开销比较大

 轻量级进程如何理解?

轻量级进程(Light-weight process, LWP)是内核支持的用户线程,一个进程可有一个或多个LWP,每个LWP是跟内核线程一对一映射的,也就是LWP都是由一个内核线程支持的,而且LWP是由内核管理并像普通进程一样被调度

在大多数系统中,LWP与普通进程的区别在于它只有一个最小的执行上下文和调度程序所需的统计信息。一般来说,一个进程代表程序的一个实例,而LWP代表程序的执行线程,因为一个执行线程不像进程那样需要那么多的状态信息,所以LWP也不带有这样的信息。

在LWP之上也是可以使用用户线程的,那么LWP与用户线程的对应关系就有三种:

  •  1 : 1 ,即一个LWP对应一个用户线程
  •  N : 1,即一个LWP对应多个用户线程
  •  M : N,即多个LWP对应多个用户线程

  1 : 1 模式

一个线程对应到一个LWP再对应到一个内核线程,如图的进程 4 ,属于此模型

  • 优点:实现并行,当一个LWP阻塞,不会影响其他LWP
  • 缺点:每一个用户线程,就产生一个内核线程,创建线程的开销较大。

 N : 1 模式

多个用户线程对应一个LWP再对应一个内核线程,如上图的进程 2 ,线程管理是在用户空间完成的,此模式中用户的线程对操作系统不可见

  • 优点:用户线程要开几个都没问题,且上下文切换发生在用户空间,切换的效率较高
  • 缺点:一个用户线程如果阻塞了,则整个进程都将会阻塞,另外在多核CPU中,没办法充分利用CPU

 M : N 模式

该模式提供了两级控制,首先多个用户线程对应多个LWP,LWP再 一一对应到内核线程,如上图的进程 3 。

  • 优点:综合了前两种的优点,大部分的线程上下文发生在用户空间,且多个线程又可以充分利用多核CPU资源

组合模式

如上图的进程 5,此进程结合 1:1 模型和 M:N 模型。开发人员可以针对不同的应用特点调节内核线程的数目来达到物理并行性和逻辑并行性的最佳方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/55556.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

APP测试基本流程及测试点总结

APP测试基本流程及测试点总结 APP自动化测试:APP自动化测试零基础必看教程,从零到一教你学会APP自动化,各种项目实战加源码等你来拿_哔哩哔哩_bilibiliAPP自动化测试零基础必看教程,从零到一教你学会APP自动化,各种项目…

【5G NR】逻辑信道、传输信道和物理信道的映射关系

博主未授权任何人或组织机构转载博主任何原创文章,感谢各位对原创的支持! 博主链接 本人就职于国际知名终端厂商,负责modem芯片研发。 在5G早期负责终端数据业务层、核心网相关的开发工作,目前牵头6G算力网络技术标准研究。 博客…

如何推导椭圆的参数方程

椭圆基础知识 椭圆定义:椭圆上任意一点到两焦点的距离之和为2a 如何由椭圆定义推出椭圆标准方程呢? 如上图所示。 由定义可得已知条件为 ∣ M C 1 ∣ ∣ M C 2 ∣ 2 a 当 M 落在顶点 P 上时,可得另一已知条件 a 2 − b 2 c 2 当有了已…

导出LLaMA等LLM模型为onnx

通过onnx模型可以在支持onnx推理的推理引擎上进行推理,从而可以将LLM部署在更加广泛的平台上面。此外还可以具有避免pytorch依赖,获得更好的性能等优势。 这篇博客(大模型LLaMa及周边项目(二) - 知乎)进行…

idea+gradle阅读spring5.2.9源码之源码构建报错解决方案

注意 1、先确保gradle版本和spring、jdk版本对应 本文:gradle:5.6.4/spring 5.2.9/jdk1.8(gradle和jdk都要先安装好,gradle还要配置好本地资源文件路径) 2、原来项目乱了的话,先重新导入下载的源码项目 3、进入源码所在根目录&…

git之reflog分析

写在前面 本文一起看下reflog命令。 1:场景描述 在开发的过程中,因为修改错误,想要通过git reset命令恢复到之前的某个版本,但是选择提交ID错误,导致多恢复了一个版本,假定,该版本对应的内容…

【安装】阿里云轻量服务器安装Ubuntu图形化界面(端口号/灰屏问题)

阿里云官网链接 https://help.aliyun.com/zh/simple-application-server/use-cases/use-vnc-to-build-guis-on-ubuntu-18-04-and-20-04 网上搜了很多教程,但是我没在界面看到有vnc连接,后面才发现官网有教程。 其实官网很详细了,不过这里还是…

java程序打包成exe在无java环境执行

最近写了个小工具,但是java写的,给朋友用的时候不能直接用,因此学习了一下java打包成exe。 众所周知,java需要jvm环境,所以打包的时候需要把稍微轻一点的jre打包进去。接下来是详细步骤。 java程序打包成jar 这个在…

Linux性能学习(4.5):网络_TCP四次挥手内核参数优化

文章目录 1 四次挥手2 参数优化2.1 tcp_orphan_retries--->FIN报文重传次数2.2 tcp_max_orphans--->孤儿连接最大数量2.3 tcp_fin_timeout--->FINE_WAIT2状态等待时间2.4 tcp_max_tw_buckets2.5 tcp_tw_reuse--->复用未释放的端口 3 总结 参考资料: 1. …

tiktok批量发布带货视频工具

tiktok批量发布带货视频工具 今天我们来讲一下最新的 29. 6 版本,这个版本新增视频处理功能,该功能主要新增以下内容,可以替换视频的原音频,可以加背景音乐,可以加视频的内置封面,可以加片头视频&#xff…

Linux Day06

目录 一、printf输出问题 二、复制进程fork 2.1进程 2.2 pid_t fork(void); 注意: 2.3逻辑地址和物理地址 2.4写时拷贝技术 一、printf输出问题 printf 函数并不会直接将数据输出到屏幕,而是先放到缓冲区中,只有一下三种情况满 足&a…

Maven发布项目到Nexus私服

项目pom配置 在项目pom.xml中文件中的仓库配置&#xff0c;Nexus私服如何搭建在这里不介绍了可自行百度。 <distributionManagement><repository><id>releases</id><name>Nexus Release Repository</name><url>http://私服地址:34…