Linux线程

文章目录

  • 线程
  • 线程原理
  • 页表
  • 线程VS进程
  • 线程相关函数
    • pthread_create函数
    • pthread_self
    • pthread_exit
    • pthread_cancel
    • pthread_join
    • pthread_detach
  • 线程ID

线程

什么是线程?为什么要有线程?
线程本质上就是轻量化的进程,一个进程就是一个执行流,在同一时间内只能去做一件事,而我们要是能把一个进程分为多个小的进程,那么就相当于把它分为多个执行流,这样在同一时间内我们就可以让一个进程去在同一时间内左不同的事情,而这个被分成的小进程就称为线程。

线程原理

我们要重谈一下进程地址空间,在之前我们通过fork函数来创建子进程,这个是不属于多线程的,因为子进程仍具有自己独立的虚拟地址空间,父子进程通过各自的页表映射到同一份物理内存,当一方发生数据改变的时候,就会进行写时拷贝,并更改页表的映射关系
在这里插入图片描述
当父子进程加载到内存里面时,因为他们之间数据很多是相同的,所以数据就会被加载两份,占据很大一部分空间,那么如何提高这个效率呢?不让相同的数据加载两份呢?

多线程,多线程相比于父子进程或者其他进程之间,是通过同一份虚拟地址空间来存储这个进程中所有线程的地址的。代码段,未初始化变量,已初始化变量等,在不同线程看来都是看到的同一份,所以只需要一份就可以了,对于线程之间不同的数据,操作系统会对他们进行划分,不同线程去拥有各自的虚拟内存,并让所有的线程通过同一份页表去映射到物理内存,这样就极大的提高了内存的利用率。
在这里插入图片描述

页表

为什么说通过多线程去做一件事,比多进程占用的内存更少呢?因为多线程是一个进程的细分,因此他只需要加载一个页表到内存,而多进程需要加载多个页表。我们一直提页表,那么页表的结构是怎么样的?虚拟地址是怎么转换成物理地址的?
我们以虚拟地址是32位为例,假设我们直接就是在一张表中一个虚拟地址对应一个物理地址,再加上权限等信息,那么一个条目大概就需要10字节,而虚拟内存有4GB,那么光页表需要的内存可能就需要40GB,这是不现实的
在这里插入图片描述

因此我们把页表划分成多级页表,一个虚拟地址是有32位的,我们将这32位划分成10+10+12位分别用来存放不同的信息
在这里插入图片描述
1-10位:用于找到该虚拟地址对应的二级页表
11-20位:用于找到该虚拟地址在二级页表中对应的页表项位置
21-32位用于存放该虚拟地址在物理内存中的偏移量
我们来对上面的映射过程进行总结:
一级页表中每个条目存放的是不同二级页表的起始地址,找到对应的二级页表后,在通过11-20位找到它在二级页表中对应的位置,二级页表中每个条目存放的是它在物理内存中对应的起始地址即找到对应的页框,而物理内存中每个页框大小为4KB,我们再通过21-32位,计算出虚拟地址在该页框中的偏移量。
每个页表对应的条目有2^10=1024个
页框大小为4KB,因此我们在通过21-32位计算出偏移量的时候2^12 = 4 * 2 ^10 = 4KB,因此不会超出该页框大小

线程VS进程

创建线程为什么要比进程更加轻量化?
因为创建线程只需要创建对应的PCB即可,虚拟内存和页表都与主线程共用一份即可。
为什么线程切换比进程切换效率更高?
如果进程切换就要重新加载数据(页表和虚拟内存等),且CPU中通过cache来存储缓存的数据,如果是进程间的切换就要重新缓存,并将数据由冷变热,而线程之间的切换,数据基本是不变的,因此不用再重新热数据
进程是资源分配的基本单位
线程是调度的基本单位
在Linux中线程和进程之间没有明确的划分
线程共享进程数据,但也拥有自己的一部分数据:
1.线程ID
2.一组寄存器(上下文数据)
3.栈
4errno
5.信号屏蔽字
6.调度优先级

进程的多个线程共享同一地址空间,因此Text Segment、Data Segment都是共享的,如果定义一个函数,在各线程中都可以调用,如果定义一个全局变量,在各线程中都可以访问到,除此之外,各线程还共享以下进程资源和环境:
1.文件描述符表
2.每种信号的处理方式(SIG_ IGN、SIG_ DFL或者自定义的信号处理函数)
3.当前工作目录
4.用户id和组id

线程相关函数

pthread_create函数

int pthread_create(pthread_t* thread, const pthread_attr_t attr, void(start_rountinue)(void*), void *arg);
pthread_create函数用来创建线程
说明:线程被创建后将立即执行

在这里插入图片描述
参数:
thread:它的类型是pthread_t,底层是无符号长整型,这是一个输出型参数,用于得到该线程ID,我们后面在对线程的操作就是通过该ID来操作的,我们后面再细讲这个无符号长整型,先说明它是一个指向共享区的一块线程起始地址
在这里插入图片描述

attr:用于设置线程的属性,我们一般设为NULL,表示使用默认属性
start_rountine:这是一个函数指针,指向一个参数为void*,返回值为void的函数
arg:它的类型是void
的,该变量用做start_rountine的参数
返回值:
在这里插入图片描述
创建成功返回0,失败返回错误码,注意这里不是返回-1,并设置错误码errno
为什么要这么做?
错误检查:
传统的一些函数是,成功返回0,失败返回-1,并且对全局变量errno赋值以指示错误。
pthreads函数出错时不会设置全局变量errno(而大部分其他POSIX函数会这样做)。而是将错误代码通过返回值返回
pthreads同样也提供了线程内的errno变量,以支持其它使用errno的代码。对于pthreads函数的错误,建议通过返回值判定,因为读取返回值要比读取线程内的errno变量的开销更小

在这里插入图片描述
创建线程等函数都是被包含在动态库pthread.h中的,因此在对该程序进行链接时,要加上-lpthread选项,去指明要链接的库

#include <iostream>
#include <pthread.h>
#include <unistd.h>using namespace std;void* routine(void* arg)
{cout << "I am a thread" << endl;sleep(5);
}int main()
{pthread_t tid;pthread_create(&tid, nullptr, routine, nullptr);sleep(5);return 0;
}

在这里插入图片描述
while :; do ps -eLf | head -1 && ps -eLf | grep mytest | grep -v grep; sleep 1;done
我们通过打印发现,同一个PID,对应有两个不同的轻量级进程,说明我们创建线程成功了,LWP和PID相同的被称为主线程,LWP:light weight process,轻量级进程

pthread_self

获取线程ID,我们可以通过创建线程的第一个参数来获取,也可以通过pthread_self函数来获取。
在这里插入图片描述
在这里插入图片描述
参数为void
返回值:该函数总是成功,返回的是当前线程的ID

#include <iostream>
#include <pthread.h>
#include <unistd.h>
#include <sys/types.h>using namespace std;void* routine(void* arg)
{cout << "other thread" << pthread_self() << endl;//通过函数获取该线程tid
}int main()
{pthread_t tid;pthread_create(&tid, nullptr, routine, nullptr);cout << "other thread ,tid:" << tid << endl;//通过参数获取刚创建的线程tidcout << "main thread ,tid:" << pthread_self() << endl;//通过函数获取主线程tidsleep(1);return 0;
}

在这里插入图片描述

pthread_exit

线程退出函数,用于退出当前线程
在这里插入图片描述
参数,是一个输出型参数
在这里插入图片描述
返回值为空。

pthread_cancel

用于退出某一个线程
在这里插入图片描述
参数pthread_cancel:要去退出线程的线程ID(tid)

在这里插入图片描述
返回值:成功返回0,失败返回一个不为0的错误码

pthread_join

线程等待函数,用于阻塞式等待回收线程
在这里插入图片描述
参数:
thread:类型是pthread_t,用于指明要去等待线程的ID,也就是tid
retval:是一个void**类型的二级指针,最终指向的是线程的返回值,如果不关心设为nullptr即可

在这里插入图片描述
返回值:成功返回0,失败将返回错误码
对于不同情况的退出,参数retval的返回值也不同:

  1. 如果thread线程通过return返回,value_ ptr所指向的单元里存放的是thread线程函数的返回值。
  2. 如果thread线程被别的线程调用pthread_ cancel异常终掉,value_ ptr所指向的单元里存放的是常数PTHREAD_CANCELED。
  3. 如果thread线程是自己调用pthread_exit终止的,value_ptr所指向的单元存放的是传pthread_exit的参数。
  4. 如果对thread线程的终止状态不感兴趣,可以传NULL给value_ ptr参数。
#include <iostream>
#include <pthread.h>
#include <unistd.h>
#include <sys/types.h>using namespace std;void* routine(void* arg)
{cout << "other thread" << pthread_self() << endl;//通过函数获取该线程tid
}int main()
{pthread_t tid;pthread_create(&tid, nullptr, routine, nullptr);cout << "other thread ,tid:" << tid << endl;//通过参数获取刚创建的线程tidcout << "main thread ,tid:" << pthread_self() << endl;//通过函数获取主线程tidpthread_join(tid, nullptr);return 0;
}

在这里插入图片描述
在不添加pthread_join(tid, nullptr);的情况下,默认是不等待线程退出的,线程都没来得及去执行routine函数

pthread_detach

分离线程,因为主线程要去回收其余线程,且是以阻塞的方式进行等待,这就会降低CPU的利用率,因此如果我们并不关系线程的返回值是什么,我们可以通过pthread_detch函数来分离线程,就是让线程自动的去释放它对应的资源,而不用再让主线程进行回收
在这里插入图片描述
参数:
thread:要去分离线程的ID
返回值:
在这里插入图片描述
成功返回0,失败返回对应的错误码

线程ID

LWP是底层线程对应的PCB结构体的唯一标识符
tid是上层每一个线程在共享区中的起始地址

LWP:什么是轻量级进程?就是线程。那么相对于我们之前学的进程ID和这个轻量级进程ID有什么关系呢?又和我们前面创建进程时的函数调用pthread_self()的返回值线程ID有什么区别呢?

在这里插入图片描述
每一个线程,它在内核中都对应有一个进程描述符,这个内核中的进程描述符就是LWP,我们在应用层又要求同一个进程中的线程pid的返回值相同,这又是怎么做到的呢?
Linux下的轻量级进程是一个PCB,每个轻量级进程都有一个自己的轻量级进程ID(PCB中的pid,也就是LWP),而同一个程序中的轻量级进程组成线程组,拥有一个共同的线程组ID
同时每一个线程又有一个tid,这个tid指向用户层的tcb,在加载到共享区的线程库中,每一个线程都有它对应的tcb结构
每个进程中都有一个LWP与线程组ID相等的线程,这个线程被称为主线程,因此当一个进程中只有一个线程时,通过LWP和进程pid来找到调度该线程是等价的的。
pthread_create是一个库函数,功能是在用户态创建一个用户线程,而这个线程的运行调度是基于一个轻量级进程实现的。
对于线程的创建,我们是通过原生线程库给我们提供的应用层接口来实现的,我们要先把原生线程库加载到共享内存当中,然后在这个共享内存中创建线程,而每一个线程都在共享内存中对应一个起始地址,这里的pthread_create的第一个参数就是这里的tid,也就是一个共享内存地址。
在这里插入图片描述
通过__thread设置线程局部存储,该变量属于每个线程的私有变量
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/292983.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

WiFi+蓝牙物联网定制方案——五大核心难点

WiFi蓝牙物联网定制方案可以根据具体需求进行定制&#xff1a; 1、设备连接方案&#xff1a;采用WiFi和蓝牙技术&#xff0c;将物联网设备与智能手机、平板电脑等设备进行连接&#xff0c;实现数据传输和远程控制。 2、数据传输方案&#xff1a;通过WiFi和蓝牙技术&#xff0c;…

云上荆楚丨云轴科技ZStack成功实践精选(湖北)

湖北自古以来有九省通衢的美称&#xff0c;地处长江中游&#xff0c;富有荆楚之美誉&#xff0c;灵秀之蕴意。2022年湖北数字经济强省三年行动计划正式印发&#xff0c;计划到“十四五”末&#xff0c;数字经济核心产业增加值力争达到7000亿元&#xff0c;占GDP的比重超过12%。…

重温经典struts1之国际化(I18N)

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 前言 拿Google网站来举例&#xff0c;在世界上不同国家和地区&#xff0c;登陆Google网站&#xff0c;网站上都会显示本国家语言&#xff0c;它是怎么做到的&#xff0c;就是…

Android平台RTSP流如何添加动态水印后转推RTMP或轻量级RTSP服务

技术背景 我们在对接外部开发者的时候&#xff0c;遇到这样的技术诉求&#xff0c;客户用于地下管道检测场景&#xff0c;需要把摄像头的数据拉取过来&#xff0c;然后叠加上实时位置、施工单位、施工人员等信息&#xff0c;然后对外输出新的RTSP流&#xff0c;并本地录制一份…

重温经典struts1之自定义类型转换器及注册的两种方式(Servlet,PlugIn)

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 前言 Struts的ActionServlet接收用户在浏览器发送的请求&#xff0c;并将用户输入的数据&#xff0c;按照FormBean中定义的数据类型&#xff0c;赋值给FormBean中每个变量&a…

C++的泛型编程—模板

目录 一.什么是泛型编程&#xff1f; ​编辑 ​编辑 二.函数模板 函数模板的实例化 当不同类型形参传参时的处理 使用多个模板参数 三.模板参数的匹配原则 四.类模板 1.定义对象时要显式实例化 2.类模板不支持声明与定义分离 3.非类型模板参数 4.模板的特化 函数模板…

限量25台,川崎亮相Ninja ZX-10RR冬季限量款

最近川崎发布了自家ZX-10RR的超级限量版&#xff0c;官方称之为冬季测试版&#xff0c;之前也有一些车型推出过冬季测试版&#xff0c;通常是在年底推出&#xff0c;因为这个时候北半球都是非常寒冷的冬天。 不过这台ZX-10RR冬季测试版&#xff0c;并不仅仅只是限量那么简单&am…

【已解决】告别CorelDraw打开CDR、复制粘贴图片卡顿问题,原来CDR卡顿是前辈们的错误习惯造成的

多年前我是 CorelDRAW 的小白&#xff0c;从 CDR 9 一直用到 CDR X4 版。在使用 CorelDRAW 过程中最令人诟病的问题就是&#xff1a;卡顿&#xff01; 打开 CDR 文件卡顿&#xff01; 复制、粘贴图片卡顿&#xff01; 区区十几MB的 CDR 文件&#xff0c;凭什么打开它要卡顿几…

如何开发一套家政预约小程序,家政系统有哪些功能?

家政服务小程序保洁上门预约维修 同城师傅入驻抢单派单平台开发 家政保洁预约小程序的功能与特点&#xff1b; 一、功能介绍 1. 小程序与公众号无缝对接&#xff0c;支持员工预约、项目预约两种方式&#xff0c;用户可随时在线预约&#xff0c;享受便捷服务。 2. 商家在预约小程…

CloudPulse:一款针对AWS云环境的SSL证书搜索与分析引擎

关于CloudPulse CloudPulse是一款针对AWS云环境的SSL证书搜索与分析引擎&#xff0c;广大研究人员可以使用该工具简化并增强针对SSL证书数据的检索和分析过程。 在网络侦查阶段&#xff0c;我们往往需要收集与目标相关的信息&#xff0c;并为目标创建一个专用文档&#xff0c…

C++(多态)

目录 前言&#xff1a; 1.多态的概念 2.多态的定义及实现 2.1多态的构成条件 2.2析构函数的重写&#xff08;基类与派生类析构函数名字不同&#xff09; 2.3虚函数重写 2.4C override 和final 2.5 重载、覆盖&#xff08;重写&#xff09;隐藏&#xff08;重定义&#…

Docker 学习总结(80)—— 轻松驾驭容器,玩转 LazyDocker

前言 LazyDocker 是一个用户友好的命令行工具,简化了 Docker 的管理。它能够通过单一命令执行常见的 Docker 任务,如启动、停止、重启和移除容器。LazyDocker 还能轻松查看日志、清理未使用的容器和镜像,并自定义指标。 简绍 LazyDocker 是一个用户友好的 CLI 工具,可以轻…