进程状态
一、基本进程状态
1.1 进程状态介绍
-
创建状态:当一个进程被创建时,它处于创建状态。在这个阶段,操作系统为进程分配必要的资源(将代码和数据拷贝到内存,创建PCB结构体等),并为其分配一个唯一的进程标识符(PID)。
-
就绪状态:在就绪状态下,进程已经准备好执行,但还没有被调度到CPU上运行。在阻塞状态下,进程会被调度到就绪队列,等待操作系统的调度器将其分配给一个可用的CPU。
-
运行状态:进程PCB被调度到CPU运行队列中排队,就叫做运行态。在这个阶段,进程的指令会被执行,它可以访问CPU和其他系统资源。只有运行状态下的进程才能占用CPU资源。
-
阻塞状态:当一个进程无法继续执行,因为它需要等待某些非CPU资源就绪时,它会进入阻塞状态。这些事件可能包括等待用户输入、等待磁盘I/O操作完成等。在阻塞状态下,进程会被调度到阻塞队列,不会占用CPU资源。只有当进程所等待的非CPU资源就绪后,进程才会从阻塞队列调度到就绪队列(就绪状态),然后再次被调度到CPU上执行。
-
挂起状态 :当内存不足时,如果一个进程长时间不执行或者处于低优先级状态,操作系统可能会将其代码和数据置换出内存并存储到磁盘上的swap分区中。其PCB(进程控制块)仍然存在于进程表中。这是因为挂起状态只是进程的一种状态,表示进程暂时无法执行,但仍然需要保留进程的信息以便后续恢复执行。这样可以释放内存资源,给其他优先级较高的进程提供更多的执行机会。这些被置换到磁盘中的进程的状态就叫做挂起。
-
终止状态:当进程完成其任务或被操作系统终止时,它进入终止状态。在这个阶段,进程可以释放所有已分配资源,并从系统中移除。
1.2 进程状态转换
进程的状态转换由调度器负责管理,进程的状态转换通常遵循以下模式:
- 创建 -> 就绪:进程被创建并准备好执行。
- 就绪 -> 运行:进程被调度到CPU上执行。
- 运行 -> 阻塞:进程需要等待某些事件的发生,无法继续执行。
- 阻塞 -> 就绪:等待的事件发生后,进程可以继续执行。
- 运行 -> 终止:进程完成其任务或被操作系统终止。
阻塞状态转换的整个过程可以详细解释如下:
- 当一个进程在执行过程中遇到了某些阻塞事件,例如等待用户输入、等待磁盘读写等,它会发出一个阻塞请求,将自己的状态标记为阻塞状态。
- 操作系统会将该进程从运行状态转换为阻塞状态,并将其从CPU运行队列中移除,使其暂停执行。
- 在阻塞状态下,进程会被放入阻塞队列中等待阻塞事件的发生。一旦阻塞事件发生,操作系统会将进程的状态从阻塞状态转换为就绪状态。
- 当进程的阻塞事件发生后,操作系统会将其重新放回就绪队列中,等待CPU的调度。
- 一旦进程被调度到CPU上执行,它的状态将从就绪状态转换为运行状态,开始继续执行。
总结起来,阻塞状态转换的过程包括从运行状态到阻塞状态的转换,等待阻塞事件发生,然后从阻塞状态到就绪状态的转换,最后再从就绪状态到运行状态的转换。这个过程允许操作系统在进程遇到阻塞事件时暂停其执行,并在事件发生后恢复执行。这种调度方式可以提高系统资源的利用率,确保CPU资源被合理分配给处于就绪状态的进程。
需要注意的是,不同的操作系统可能会有不同的状态命名和状态转换方式,但通常都会包含上述基本状态。
二、Linux中的进程状态
上面介绍的基本进程状态是理论上一个进程所具有的状态。其为操作系统的进程状态设计提供了理论依据。
但实际上不同的操作系统为实现上述的理论会设计不同的进程状态。下面介绍的是Linux中的进程状态:
2.1 进程状态介绍
内核源码:
/*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] = {
"R (running)", /* 0 */
"S (sleeping)", /* 1 */
"D (disk sleep)", /* 2 */
"T (stopped)", /* 4 */
"t (tracing stop)", /* 8 */
"X (dead)", /* 16 */
"Z (zombie)", /* 32 */
};
-
R状态:运行或就绪状态
-
S状态:可中断睡眠状态(阻塞、挂起),即睡眠状态可以通过发送信号等方式被动唤醒,或由操作系统直接中断。
-
D状态:磁盘睡眠状态(IO阻塞、IO挂起),不可被动唤醒,不可被中断
-
T状态:信号暂停状态,表示进程被暂停,并且可以通过信号来暂停或恢复进程的执行:-19暂停,-18继续。
-
t状态:调试暂停状态,表示进程被调试器(如gdb)跟踪调试,并且暂停了进程的执行。通常是由于调试器设置了断点或执行了单步调试操作而进入的状态。
-
Z状态:僵尸状态(终止),是指一个已经终止的子进程,但其父进程尚未获取子进程的退出状态。僵尸进程不会占用系统资源,因为它们已经终止并释放了大部分资源。僵尸进程只在进程表中保留一条记录,以便父进程在需要时获取子进程的退出状态。
-
X状态:终止状态,瞬时性非常强
2.2 进程状态转换
2.3 浅度睡眠(S) VS 深度睡眠(D)
在Linux中,进程的S状态和D状态是两种不同的状态。
- S状态(Sleeping):表示进程正在等待某个事件的发生,例如等待I/O操作完成、等待信号量等。在S状态下,进程是可被调度的,即可以被操作系统调度执行其他任务。
- D状态(Uninterruptible Sleep):也称为不可中断睡眠状态,表示进程正在等待某个事件的发生,但是在此期间不可被中断。通常情况下,D状态是由于进程正在等待磁盘I/O操作完成而引起的。在D状态下,进程是不可被调度的,即操作系统无法将其切换到其他任务上执行。
总结起来,S状态表示进程正在等待某个事件的发生,但是可以被调度执行其他任务;而D状态表示进程正在等待某个事件的发生,但是在此期间不可被中断,无法被调度执行其他任务。
举个栗子:
当服务器压力过大时,OS会通过一定的手段终止一些进程,起到节省资源的作用。此时访问磁盘的进程如果为S状态就可能被OS杀掉,从而导致数据丢失。所以进程访问磁盘时,为了防止进程异常终止而造成的数据丢失等问题的出现,该进程会被设置D状态。D状态下的进程不能被OS终止,只能等该进程得到磁盘读写结果后自动唤醒。
S状态测试:
int main{while(1){//如果循环体为空,则查到的进程状态为R+cout << "hello world!" << endl; //如果循体中涉及IO,则一般查到的进程状态为S+}return 0;
}
- 与CPU的运行速度相比,IO过程所用的时间要多得多,所以该进程多数时间是在阻塞队列中等待IO,因此查到的状态为S
- 状态标识后的+号,表示该进程为前台进程,前台进程占用命令行解释器,即进程运行过程中bash不能继续接收命令。
./ test.out &
在运行命令后加&,可以使程序后台运行,同时返回进程号和进程PID。
运行结果:
2.4 僵尸进程(Z) VS 孤儿进程
- 僵死状态(Zombies)是一个比较特殊的状态。当子进程退出并且父进程没有读取到子进程退出的返回代码时(使用wait()系统调用)就会产生僵死(尸)进程
- 僵死进程会以终止状态保持在进程表中,并且会一直在等待父进程读取退出状态代码。
- 所以,只要子进程退出,父进程还在运行,但父进程没有读取子进程的退出状态,子进程就会进入Z状态
Z状态测试:
int Test1(){ pid_t id = fork(); if(id < 0) { //创建失败 cerr << "fork" << endl; return 1; } else if(id == 0) { //子进程暂停3s后终止cout << "I'm child process, "; cout << "pid:" << getpid() << " "; cout << "ppid:" << getppid() << endl; sleep(3); return 0; } else{ //父进程死循环 while(1) { cout << "I'm parent process, ";cout << "pid:" << getpid() << " ";cout << "ppid:" << getppid() << endl;sleep(1);}return 0;}
}
运行结果:
僵尸进程危害
- 僵尸进程的退出状态必须被维护下去,维护退出状态本身就是要用数据维护,也就是说僵尸进程的PCB不能回收。
- 内存中的PCB如果不及时回收,会造成内存泄漏,导致操作系统内中的可用资源越来越少。
- 僵尸进程本身不会占用系统资源,但如果大量的僵尸进程积累,会占用一定的进程表项和内核资源,因此及时回收僵尸进程是很重要的。
- 一个用户能创建的进程是有限的,僵尸进程过多,会导致创建新的子进程失败等诸多问题。
孤儿进程
- 如果父进程提前退出,那么此时未退出的子进程就被称为”孤儿进程“
- 孤儿进程会被1号init进程领养,当然要由init进程回收喽。
- 为什么要被领养? 答:未来子进程退出,原先的父进程早已不在,需要领养进程将其回收。
测试代码:
int Test2(){ pid_t id = fork(); if(id < 0) { //创建失败 cerr << "fork" << endl; return 1; } else if(id == 0) { //子进程死循环 while(1) { cout << "I'm child process, "; cout << "pid:" << getpid() << " "; cout << "ppid:" << getppid() << endl; sleep(1); } return 0; } else{ //父进程暂停3s后终止 cout << "I'm parent process, "; cout << "pid:" << getpid() << " "; cout << "ppid:" << getppid() << endl; sleep(3);return 0;}
}
运行结果:
注意:子进程变为孤儿进程后,会从前台进程转为后台,所以此时的
Ctrl c
无法终止子进程。
三、你问我答
3.1 简单介绍一下进程表、运行队列、就绪队列、阻塞队列
进程表、运行队列、就绪队列和阻塞队列是操作系统中用于管理进程的重要数据结构。它们的作用和功能如下:
-
进程表:进程表是操作系统中维护的一个数据结构,用于记录系统中所有进程的相关信息。每个进程都在进程表中有一个对应的表项,包含进程的标识符、状态、优先级、资源占用情况等信息。进程表提供了对进程的管理和调度的基础。
-
运行队列:运行队列是一个数据结构,用于存放当前正在运行的进程。只有运行队列中的进程才能占用CPU资源。在多道程序设计环境下,操作系统通过运行队列来管理和调度进程的执行顺序。运行队列通常是以多级反馈队列的形式存在,根据进程的优先级和调度策略来决定进程的执行顺序。
-
就绪队列:就绪队列是一个数据结构,用于存放处于就绪状态的进程。就绪队列中的进程已经完成了所需的非CPU资源的等待,可以立即被调度到CPU上执行。就绪队列通常是以优先级队列的形式存在,根据进程的优先级来决定进程的调度顺序。
-
阻塞队列:阻塞队列是一个数据结构,用于存放处于阻塞状态的进程。阻塞状态的进程正在等待某些非CPU资源就绪,无法继续执行。阻塞队列通常是以链表或队列的形式存在,用于管理处于阻塞状态的进程,并在资源就绪后将其移出阻塞队列,放入就绪队列等待调度。
这些数据结构共同协作,帮助操作系统有效地管理和调度进程,以实现进程的并发执行和资源的合理利用。
就绪队列 VS 运行队列:
就绪队列是存放处于就绪状态的进程或线程的队列,而运行队列是存放当前正在运行的进程或线程的队列。就绪队列中的进程或线程等待调度器的选择,而运行队列中的进程或线程正在占用CPU资源执行任务。
3.2 操作系统调度器的作用有哪些?
操作系统调度器的作用是决定哪个进程获得CPU的执行时间,并管理进程的状态转换。它负责从就绪队列中选择一个进程分配CPU资源,以实现多任务并发执行。
具体来说,操作系统调度器的主要作用包括:
-
进程调度:调度器根据调度算法和策略,从就绪队列中选择一个进程分配CPU资源,使其开始执行。调度器可以根据不同的调度算法,如先来先服务(FCFS)、最短作业优先(SJF)、时间片轮转等,来决定进程的执行顺序。
-
进程状态管理:调度器负责管理进程的状态转换。它将新创建的进程放入就绪队列,将正在执行的进程放入运行队列,将等待某些事件或资源的进程放入阻塞队列。当进程等待的事件或资源就绪时,调度器会将其从阻塞队列转移到就绪队列中,以便继续执行。
-
资源管理:调度器需要管理和分配系统资源,如CPU时间片、内存空间、设备等。它根据进程的优先级和资源需求,合理分配和调度资源,以提高系统的效率和性能。
-
响应时间控制:调度器需要保证系统对用户请求的响应时间。它会根据用户的优先级和请求类型,合理分配CPU资源,以确保及时响应用户的操作和请求。
总之,操作系统调度器的作用是通过合理的进程调度和资源管理,实现多任务的并发执行,提高系统的效率和性能。