Linux进程和线程
- 进程是资源分配的基本单位
- 线程是调度的基本单位
- 线程共享进程数据,但是也有自己的一部分数据:线程ID(LWP)、一组寄存器、栈、errno、信号屏蔽字、调度优先级
进程的多个线程共享 同一地址空间,因此Text Segment、Data Segment都是共享的,如果定义一个函数,在各线程中都可以调用,如果定义一个全局变量,在各线程中都可以访问到,除此之外,各线程还共享以下进程资源和环境:
- 文件描述符表
- 每种信号的处理方式(SIG_ IGN、SIG_ DFL或者自定义的信号处理函数)
- 当前工作目录
- 用户id和组id
Linux线程控制
之前我们说过Linux下没有真正意义上的线程,而是用进程模拟的线程,所以Linux不会直接提供直接创建线程的接口,它会给我们最多提供轻量级进程的接口,而在用户的视角只认线程,那么在用户和操作系统之间就需要有库来将Linux接口封装,对上给用户提供线程控制的接口。这个库就被称为用户级线程库 -- pthread库,在任何的Linux操作系统下这个库都必须原生自带。因此在编译的时候就需要带有库的链接。
创建线程
pthread_create函数
功能:创建一个新的线程
原型
int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine)(void*), void *arg);
参数
thread:返回线程ID
attr:设置线程的属性,attr为NULL表示使用默认属性
start_routine:是个函数地址,线程启动后要执行的函数
arg:传给线程启动函数的参数
返回值:成功返回0;失败返回错误码
void* thread_run(void* args) {while (true) {cout << "new thread running" << endl;sleep(1);}return nullptr;
}int main() {pthread_t t; // typedef unsigned long int pthread_t;pthread_create(&t, nullptr, thread_run, nullptr);while (true) {cout << "main thread running, newthread id : " << t << endl;sleep(1);}
}
上面就是一段简单的多线程代码,它执行的结果如图所示,可以看出线程的id的数很奇怪与我们之前说的LWP不一样,这个问题稍后我们会进行解答。
可以通过pthread_self(void);函数来获取对应的线程ID。
线程终止
如果需要只终止某个线程而不终止整个进程,可以有三种方法:
- 从线程函数return。这种方法对主线程不适用,从main函数return相当于调用exit。
- 线程可以调用pthread_ exit终止自己。
- 一个线程可以调用pthread_ cancel终止同一进程中的另一个线程。
pthread_exit函数
功能:线程终止
原型
void pthread_exit(void *value_ptr);
参数
value_ptr:value_ptr不要指向一个局部变量。
返回值:无返回值,跟进程一样,线程结束的时候无法返回到它的调用者(自身)
pthread_cancel函数
功能:取消一个执行中的线程
原型
int pthread_cancel(pthread_t thread);
参数
thread:线程ID
返回值:成功返回0;失败返回错误码
线程等待
为什么需要线程等待?
- 已经退出的线程,其空间没有被释放,仍然在进程的地址空间内。
- 创建新的线程不会复用刚才退出线程的地址空间。
功能:等待线程结束
原型
int pthread_join(pthread_t thread, void **value_ptr);
参数
thread:线程ID
value_ptr:它指向一个指针,后者指向线程的返回值
返回值:成功返回0;失败返回错误码
调用该函数的线程将挂起等待,直到id为thread的线程终止。thread线程以不同的方法终止,通过pthread_join得到的终止状态是不同的,总结如下:
- 如果thread线程通过return返回,value_ ptr所指向的单元里存放的是thread线程函数的返回值。
- 如果thread线程被别的线程调用pthread_ cancel异常终掉,value_ ptr所指向的单元里存放的是常数PTHREAD_ CANCELED。
- 如果thread线程是自己调用pthread_exit终止的,value_ptr所指向的单元存放的是传给pthread_exit的参数。
- 如果对thread线程的终止状态不感兴趣,可以传NULL给value_ ptr参数。
分离线程
默认情况下,新创建的线程是joinable的,线程退出后,需要对其进行pthread_join操作,否则无法释放资源,从而造成系统泄漏。
如果不关心线程的返回值,join是一种负担,这个时候,我们可以告诉系统,当线程退出时,自动释放线程资源。
int pthread_detach(pthread_t thread);
可以是线程组内其他线程对目标线程进行分离,也可以是线程自己分离:
pthread_detach(pthread_self());joinable和分离是冲突的,一个线程不能既是joinable又是分离的。
线程库、线程ID等概念
我们使用的线程库是真实存在的,通过前面的知识我们知道库就会被加载虚拟地址空间中的共享区中,而进程中的线程可以随时访问库中的代码和数据 -- 关于线程的管理,创建类似管理线程的TCB。举例来说,在学习文件系统的时候,每个文件有自己的文件描述符表,但是无论是在使用c的时候,我们都没有直接使用fd,而是使用的库给我们提供的fopen、fclose等等。同样在线程这里,在创建线程的时候就有LWP,为了更好的管理LWP,就有了共享库中的TCB。因此这个库被称为用户级线程库。
所有新线程都有自己独立的栈结构,主线程用的是进程系统栈,新线程用的是库中提供的栈。