操作系统系列:Unix进程系统调用fork,wait,exec

操作系统系列:Unix进程系统调用

  • fork系统调用
    • fork()运用的小练习
  • wait系统调用
  • Zombies
  • exec 系列系统调用

开发者可以查看创建新进程的系统调用,这个模块会讨论与进程相关的Unix系统调用,下一个模块会讨论Win32 APIs相关的进程。

fork系统调用

在经典的Unix系统,所有的进程都是用fork()创建的,这个系统调用创建一个新的进程,这个新的进程是调用fork的进程的完美副本,这个调用进程被称为父进程,而fork创建的新进程被称为子进程。父子进程都是可运行的,并且在fork系统调用后立即开始运行。
这是函数原型:

#include <sys/tepes.h>
#include <unistd.h>
pid_t fork(void);

数据类型pid_t是进程id的类型,在所有系统上它都是一个无符号整型。fork()的返回值很重要,在父进程中,这个从fork()中返回的值是子进程的进程id。在子进程中,fork()的返回值是0。在有错误的情况下,fork()会返回一个负值。请看示例:

#include <unistd.h>
#include <sys/types.h>
#include <stdio.h>
extern int errno;
int main()
{pid_t pid;pid = fork();if(pid == 0)printf("I'm the child\n");else if(pid > 0){printf("I'm the parent\n");printf("child pid is %d\n",pid);}else{/* pid < 0 */perror("Error forking");fprintf(stderr,"errno is %d\n",errno);}return 0;
}

当正在运行的程序执行第8行的fork系统调用时,就会创建一个新进程,该子进程与父进程具有完全相同的代码。这个例子中没有其他变量,但是如果父进程中碰巧有一个名为 x 的变量,其值为 17,那么子进程中也会有一个名为 x 的变量,其值为 17。 父子进程都会在fork这行以后开始运行,开发者区分父子进程的唯一方式,是通过fork的返回值。
下面这个图展示了在进程1234调用fork创建子进程1235之前和之后的进程图。
进程图
在正常情况下,调用 fork 不太可能失败。 但是,所有 Unix 系统对单个用户可以运行的进程总数以及进程表中同时存在的进程总数都有限制,因此如果创建新进程会导致超过两者中的任意一个限制,就会失败并返回负值,也不会创建子进程。
以下几条父子进程是一样的:

  • 文本段(代码段)
  • 所有变量的值(除了fork()的返回值)
  • 环境
  • 进程优先级
  • 控制终端
  • 当前工作目录
  • 打开文件描述符

要知道,尽管这些变量的值是一样的,所有不同的数据段,包括运行时的堆栈都已被拷贝,所以每个变量有两个实例,从而允许每个进程各自独立地更新这些数据。
父进程和子进程的区别如下:

  • 进程号
  • 父进程id
  • 有关资源分配的数据。 例如,子进程中的总运行时间设置为零,子进程的进程启动时间设置为当前时间

要知道每个进程除了init进程(init进程pid为0,并且是在启动时创建的第一个进程,在系统shut down之前一直运行)都有一个父进程,因此存在一个以 init 为根的进程树。

这是 fork 的作用:

  • 给子进程的数据和栈预留交换空间
  • 分配新的pid和内核进程结构
  • 初始化内核进程结构,某些字段(即用户id,组id,信号掩码)是从父进程拷贝的,某些字段设置为0(即cpu使用率),其它字段像ppid点是子进程的特定值
  • 为子进程分配地址转换映射
  • 增加子进程到进程集,共享父进程正在执行的文本区域
  • 复制父进程的数据和堆栈区域
  • 获取对子进程继承的共享资源的引用,比如打开的文件
  • 通过拷贝父进程寄存器初始化硬件上下文
  • 让子进程运行起来,并且将其放入调度进程队列
  • 安排子进程以零值从fork返回
  • 返回子进程的id给父进程

fork()运用的小练习

这是一个简短的程序。 假设本机上没有其他进程在运行,那么当创建一个新进程时,它的进程id比当前进程大1。
系统调用getpid()返回了调用它的进程id,系统调用getppid()返回父进程的进程id。
Note: 系统调用getpid和getppid不能失败。
该进程的父进程是 shell。 如果这个程序被编译并运行,并且在一次特定的运行过程中,它的进程id是1000,而shell的进程id是500,那么这个程序会打印什么?

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
int main()
{pid_t p,x,y;x = getpid();printf("%d\n",x);	/* prints 1000 */y = getppid();printf("%d\n",y); /* prints 500 */p = fork();if(p > 0) {sleep(1); /* sleep for on second */printf("%d\n",p);x = getpid();printf("%d\n",x);y = getppid();printf("%d\n",y);exit(0);}else if(p == 0){printf("%d\n",p);x = getpid();printf("%d\n",x);y = getppid();printf("%d\n",y);exit(0);}return 0;
}

wait系统调用

父进程和子进程谁先运行是不确定的,这个术语叫竟态条件。因此这个程序有2个可能的输出:

I'm the child
I'm the parent, child pid is 22970

是其中一种,另一种是:

I'm the parent, child pid is 22970
I'm the child

父进程可以通过wait()系统调用来控制这一点,这个调用会导致在子进程消亡之前,父进程都是被阻塞的。如果父进程没有子进程,那么wait会立即返回。
这里是函数原型:

 #include <sys/types.h>#include <sys/wait.h>pid_t wait(int *stat_loc);

wait 的返回值是死亡子进程的进程 ID,这个简短的程序用来演示这一点。

#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <stdio.h>
extern int errno;
int main()
{pid_t pid,retval;int status;pid  = fork();if(pid == 0)printf("I'm the child\n");else if(pid > 0){retval = wait(&status);printf("I'm the parent,");printf("the child %d has died\n",retval);}else{ /* pid < 0 */perror("Error forking");fprintf(stderr,"errno is %d\n",errno);}return 0;
}

如果父进程碰巧先运行,它将执行 wait 系统调用,这会导致进程阻塞,它保持阻塞状态,直到子进程终止,此时一个信号被发送到父进程,唤醒它并返回到可运行状态。 如果子进程恰好先运行并在父进程运行之前终止,则对 wait 的调用将立即返回。 无论哪种情况,返回值都是子进程的进程 ID。

垂死孩子的父母可能想知道孩子是如何死亡的,所以子进程可能想向父进程发送消息,这两者都是使用传递给 wait 的参数来完成的。 因为这是一个引用参数,所以它的值是由系统调用设置的。 最低有效字节指示子进程如何死亡。 如果子进程正常终止(即进程到达 main() 的末尾或调用了 exit() 系统调用),则状态的最低字节将为零。 如果子进程异常终止(例如,由于内存异常错误(分段错误)或用户发送终止信号(cntl-c)而终止),则最低字节将设置为终止它的信号的数值 。

如果子进程通过调用 exit() 正常终止,则子进程可以将参数传递给 exit(),并且该值将位于status的第二个字节中。 例如,如果子进程调用 exit(5),则状态的二进制值将是:

00000000 00000000 00000101 00000000
十六进制表示为 00 00 05 00

科普一下C语言的运算符:

这里, >>是右移运算符,<< 是左移运算符,& 是按位与运算符,| 是按位或运算符。
开发者可以使用它们来检查状态的每个字节的值。 例如,要检查最低位字节是否为零,请使用按位与运算符和 0xFF(C 中数字常量前面的 0x 表示该值是十六进制的)。

  if (status & 0xFF != 0)  printf("The child died abnormally");

要检查第三个字节的值,请将值右移 8 位,然后使用 0xFF 执行逻辑与。

   int temp;....temp = status >> 8; /* right shift */temp = temp & 0xFF; printf("exit status was %d\n",temp);

如果一个进程在其所有子进程终止之前终止,则子进程将成为“孤儿”。 由于除 init 之外的所有进程都有父进程,因此“孤儿”进程会被 init 进程回收。

Zombies

  • 如果子进程在其父进程调用 wait() 之前死亡,则父进程可能会在稍后的某个时间调用 wait,并且需要有关已死亡子进程的状态的信息。 在这种情况下,进程并没有真正终止,只是保留了一些信息。
  • 已终止但其父进程未调用 wait() 的进程称为僵尸进程。 僵尸进程虽然不消耗其他资源,但在操作系统的进程表中占据一个槽位。
  • 当您使用 ps 命令检查计算机上的进程时,僵尸的状态已失效。
  • 当父级调用 wait 并获取有关该子级的信息或父级死亡时,僵尸将被终止,因为父级为 init 的僵尸将被杀死。

exec 系列系统调用

  • 由前文可知,由于 fork 只能创建其自身的副本,因此它的用途有限。
  • fork 调用通常与另一个系统调用 exec 一起使用,后者用全新的进程映像覆盖整个进程空间,新映像会从头开始执行。
  • Exec 实际上是有六个系统调用的族,其中最简单的是 execl 下面是函数原型:
     #include <unistd.h>  /* standard unix header file */int execl(const char *path, const  char  *arg0,  ...,  constchar *argn, NULL);

第一个参数 path 应该是可执行程序的路径名。 其余参数是要作为 argv 传递给该程序的参数。 参数列表以 NULL 结束。

这是一个简短的示例程序。

#include <sys/types.h>
#include <unistd.h>
#include <stdio.h>
#include <wait.h>
extern int errno;
int main()
{pid_t p;p=fork();if (p == 0)  { /* child */execl("/bin/ls", "ls", "-l", NULL);perror("Exec failed");}else if (p > 0) {wait(NULL);printf("Child is done\n");}else {perror("Could not fork");}return 0;
}

该程序会创建一个新进程。 子进程的映像被命令 /bin/ls 的映像覆盖,并且使用两个参数 ls 和 -l 来调用它(回想一下,按照约定,argv[0] 是命令的名称),然后子进程运行 ls,当它终止时,父进程被唤醒,显示其消息,并且也终止。
内存中的进程布局
任何 exec 调用都可能失败,比较明显的失败原因是路径不是可执行文件的路径名。

  • 如果任何 exec 调用成功,则不会返回,因为调用进程的所有代码都会被新映像覆盖。
  • 如果失败,它会像任何其他系统调用一样返回负值,但不需要检查这一点,因为它只有在失败时才能返回。
  • 这就是为什么 perror 调用之前没有 if 的原因,程序到达该行的唯一方法是调用 execl 失败。

exec 系列中还有其他五个系统调用,都是用新的镜像覆盖当前进程,而他们的不同之处仅在于他们所接受的参数以及其他一些细微的方面。

int execv(const char *path, char *const argv[])
此调用与 execl 相同,只是它只接受两个参数,第二个参数是参数向量。
示例程序:

#include <sys/types.h>
#include <unistd.h>
#include <stdio.h>
#include <wait.h>
extern int errno;
int main()
{pid_t p;char *args[100];args[0]="ls";args[1]="-l";args[2]=NULL;p=fork();if (p == 0)  { /* child */execv("/bin/ls", args);perror("Exec failed");}else if (p > 0) {wait(NULL);printf("Child is done\n");}else {perror("Could not fork");}return 0;
}

int execle(const char *path, const char *arg0, …, const char *argn, char * /NULL/, char *const envp[])
与 execl 一样,此调用采用可变数量的参数,但其最终参数是表示新环境的向量。
默认情况下,执行的进程的环境与父进程的环境相同,但这允许用户更改环境。

#include <sys/types.h>
#include <unistd.h>
#include <stdio.h>
#include <wait.h>
extern int errno;
int main()
{pid_t p;char *envp[100];envp[0]="USER=ingallsr";envp[1]="HOME=/cs/ingallsr";envp[2]="PWD=/cs/ingallsr/public.html/OS/c4";envp[3]=NULL;    p=fork();if (p == 0)  { /* child */execle("/bin/ls", "ls", "-l", NULL, envp);perror("Exec failed");}else if (p > 0) {wait(NULL);printf("Child is done\n");}else {perror("Could not fork");}return 0;
}

int execve(const char *path, char *const argv[], char *const envp[])
与 execv 相同,只是它传递环境向量作为第三个参数。

int execlp(const char *file, const char *arg0, …, const char *argn, char * /NULL/)
这与上面的调用不同,它的第一个参数只是文件名而不是路径,并且调用在 PATH 环境变量中搜索可执行文件。

#include <sys/types.h>
#include <unistd.h>
#include <stdio.h>
#include <wait.h>
extern int errno;
int main()
{pid_t p;p=fork();if (p == 0)  { /* child */execlp("ls", "ls", "-l", NULL);perror("Exec failed");}else if (p > 0) {wait(NULL);printf("Child is done\n");}else {perror("Could not fork");}return 0;
}

int execvp(const char *file, char *const argv[])
与 execlp 相同,只是参数作为单个参数传递。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/286364.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

德人合科技 | 公司电脑文件加密系统

公司电脑文件加密系统是一种可以对电脑文件进行加密的保护机制。它使用驱动层透明加密技术&#xff0c;能够在用户无感知的情况下对文件进行加密&#xff0c;从源头上保障数据安全和使用安全。 PC端访问地址&#xff1a; www.drhchina.com 此类系统主要有以下几个特点和功能&a…

ffmpeg入门之Windows开发之二(视频转码)

添加ffmpeg windows编译安装及入门指南-CSDN博客 的头文件和依赖库如下&#xff1a; main 函数如下&#xff1a; extern "C" { #ifdef __cplusplus #define __STDC_CONSTANT_MACROS #endif } extern "C" { #include <libavutil/timestamp.h> #in…

概率论复习

第一章&#xff1a;随机概率及其概率 A和B相容就是 AB 空集 全概率公式与贝叶斯公式&#xff1a; 伯努利求概率&#xff1a; 第二章&#xff1a;一维随机变量及其分布&#xff1a; 离散型随机变量求分布律&#xff1a; 利用常规离散性分布求概率&#xff1a; 连续性随机变量…

一份来自政治学研究者的大模型“实用指南”

大模型&#xff0c;对一个社会科学的研究者意味着什么&#xff1f; 如果抛开一些为了追新打快蹭热点而进行的类似大模型万物的“交叉科学”与“跨界研究”&#xff0c;只是将大模型视为一个“强大的工具”&#xff0c;那么这种“智能工具”如何赋能社会科学研究呢&#xff1f;…

轻空间气膜体育馆打造绿色运动空间

近年来&#xff0c;我国为全面实施全民健身战略&#xff0c;坚持“发展群众体育&#xff0c;服务健康中国”的理念&#xff0c;积极推动群众参与各类体育活动。为了满足全民健身和全面小康的深度融合发展需求&#xff0c;我国正在不断拓展公共体育设施的建设与开放。气膜体育馆…

光储充综合新能源储能系统研究笔记

1. 微电网与储能 1.1. 储能 1.1.1. 概述 储能是指电力储能&#xff0c;属于一种电网供需平衡技术。电力储能的形式通常是通过将电能转化为动能、(水)势能、化学能等形式进行储存&#xff0c;在需要时再转化回电能。尽管电力储能技术并非新兴技术&#xff0c;但从产业角度来看…

服务器解析漏洞是什么?攻击检测及修复

服务器解析漏洞&#xff08;Server-side Include Vulnerability&#xff0c;SSI漏洞&#xff09;是一种安全漏洞&#xff0c;通常出现在支持服务器端包含&#xff08;SSI&#xff09;功能的Web服务器上。SSI是一种在Web页面中嵌入动态内容的技术&#xff0c;允许开发人员将外部…

Amazon CodeWhisperer 体验

文章作者&#xff1a;jiangbei 1. CodeWhisperer 安装 1.1 先安装 IDEA&#xff0c;如下图&#xff0c;IDEA2022 安装为例&#xff1a; 亚马逊云科技开发者社区为开发者们提供全球的开发技术资源。这里有技术文档、开发案例、技术专栏、培训视频、活动与竞赛等。帮助中国开发者…

漏洞复现-TurboMail viewfile 文件读取漏洞(附漏洞检测脚本)

免责声明 文章中涉及的漏洞均已修复&#xff0c;敏感信息均已做打码处理&#xff0c;文章仅做经验分享用途&#xff0c;切勿当真&#xff0c;未授权的攻击属于非法行为&#xff01;文章中敏感信息均已做多层打马处理。传播、利用本文章所提供的信息而造成的任何直接或者间接的…

目标检测——YOLO算法解读(通俗易懂版)

论文&#xff1a;You Only Look Once: Unified, Real-Time Object Detection 作者&#xff1a;Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi 链接&#xff1a;https://arxiv.org/abs/1506.02640 代码&#xff1a;http://pjreddie.com/yolo/ yolo系列检测算法开…

C#经常用的加密解密算法

1. 引言 在软件开发中&#xff0c;数据的安全性和保密性非常重要。为了保护数据免受未经授权的访问和泄露&#xff0c;我们经常需要对敏感数据进行加密和解密。在C#中&#xff0c;有许多常用的加密解密方法可供选择。本文将详细介绍C#中经常使用的加密和解密方法。 目录 1. 引…

QT设置鼠标样式 QWidget::setCusor()

1、使用Qt内置鼠标样式 例如手型&#xff1a; button->setCursor(Qt::PointingHandCursor); 其他类型&#xff1a; 2.自定义鼠标样式3种方式&#xff1a; 2.1.使用函数生成鼠标样式的图片 2.2使用画图工具生成鼠标样式的图片 2.3使用XPM生成鼠标样式 这三种方式参考&…