【操作系统概念】第4章：线程-编程知识

文章目录

0.前言
4.1 概述
- 4.1.1 多线程编程的优点
4.2 多线程模型
- 4.2.1 多对一模型
- 4.2.2 一对一模型
- 4.2.3 多对多模型
4.3 线程库
4.4 多线程问题
- 4.4.1 系统调用fork()和exec()
- 4.4.2 取消
- 4.4.3 信号处理
- 4.4.4 线程池
- 4.4.5 线程特定数据

0.前言

第3章讨论的进程模型假设每个进程是具有单个控制线程的一个执行程序。不过，几乎所有现代操作系统都允许一个进程包含多个线程。本章引入多线程计算机系统有关的许多概念，并且讨论Pthreads、Windows和Java线程库的API

本章目标：

引入线程概念，即CPU使用的基本单元，它构成多线程计算机的基础
讨论Pthreads、Windows和Java线程库的API
探讨多种策略以便提供隐式线程
讨论多线程相关的问题
讨论Windows和Linux操作系统的线程支持

4.1 概述

线程是CPU使用的基本单元，由线程ID，程序计数器，寄存器集合和栈组成。它与属于同一进程的其他线程共享代码段，数据段和其他操作系统资源。
在这里插入图片描述

4.1.1 多线程编程的优点

响应度高：一个多线程的程序即使部分阻塞，其他部分仍能运行，从而增加了对用户的响应程度。
资源共享
经济：创建和切换线程比创建进程更节省资源和时间
多处理器体系结构的利用：多线程能充分利用多处理器体系

4.2 多线程模型

提供多线程支持有两种方式：用户线程和内核线程

用户线程受内核支持，无须内核管理
内核线程由操作系统支持和管理

在用户线程和内核线程之间存在一定的关系，即多线程模型，以下讨论三种常用的关系：多对一，一对一，多对多

4.2.1 多对一模型

多个用户线程映射到一个内核线程

优点：线程管理由线程库在用户空间完成，效率比较高
缺点：如果一个线程阻塞，整个进程就会阻塞；且多个线程无法并行运行在多处理器上

4.2.2 一对一模型

每个用户线程映射到一个内核线程上

优点：比多对一模型更好的并发功能；一个线程阻塞时，其他线程能够继续调用；多个线程能够并发运行在多处理器
缺点：创建内核线程的开销会影响应用程序的功能

4.2.3 多对多模型

多对一模型可以创建任意多的用户线程，但是只能没有增加并发性
一对一模型增强了并发性，但开发者要小心不能在应用程序中创建太多的进程

多对多模型没有上述的所有缺点，它多路复用了许多用户线程到同样数量或更小数量的内核线程上
在这里插入图片描述

4.3 线程库

在用户空间中提供一个没有内核支持的库
执行一个由操作系统直接支持的内核级的库

4.4 多线程问题

4.4.1 系统调用fork()和exec()

在多线程程序中，系统调用fork()和exec()的语义有所改变。

如果程序中一个进程调用fork()，那么新进程会复制所有线程，还是新进程只有单个线程？有的UNIX系统有两种形式的fork()，一种复制所有线程，另一种只复制调用了系统调用fork()的线程。

Exec()工作方式：如果一个线程调用系统调用exec()，那么exec()参数所指定的程序会替换整个进程，包括所有线程。

如果调用fork()之后立即调用exec()，那么没有必要复制所有线程，因为exec()参数所指定的程序会替换整个进程。在这种情况下，只复制调用线程比较适当。不过，如果在fork()之后另一进程并不调用exec(),那么另一进程就应复制所有进程。

4.4.2 取消

线程取消（thread cancellation） 是在线程完成之前来终止线程的任务。

要取消的线程通常称为目标线程。目标线程的取消可在如下两种情况下发生：

一是异步取消（asynchronous cancellation）：一个线程立即终止目标线程。
二是延迟取消（deferred cancellation）：目标线程不断地检查它是否应终止，这允许目标线程有机会以有序方式来终止自己。

如果资源已经分配给要取消的线程，或者要取消的线程正在更新与其他线程所共享的数据，那么取消会有困难，对于异步取消尤为麻烦。操作系统回收取消线程的系统资源，但是通常不回收所有资源。
因此，异步取消线程并不会使所需的资源空闲。相反采用延迟取消时，允许一个线程检查它是否是在安系统资源空闲全的点被取消，pthread称这些点为取消点（cancellation point）。