Linux--进程的概念(一)

目录

  • 一、冯诺依曼体系结构
  • 二、操作系统
    • 2.1 什么是操作系统
    • 2.2 操作系统的意义
  • 三、进程
    • 3.1 进程的基本概念
    • 3.2 描述进程——PCB
    • 3.3 进程和程序的区别
    • 3.4 task_struct-PCB的一种
    • 3.5 task_struct的内容分类
  • 四、如何查看进程
    • 4.1 通过系统文件查看进程
    • 4.2 通过ps指令查看进程
  • 五、如何获取pid和ppid
    • 5.1 getpid()--获取子进程(pid)
    • 5.2 getppid()--获取父进程(ppid)
  • 六、进程的创建--fork初识
    • 6.1 四种主要事件会导致进程的创建
    • 6.2 用户如何请求创建一个新进程
    • 6.3 如何让父子进程各有所需
  • 七、进程的状态
    • 7.1 进程状态有哪些
    • 7.2 进程状态的查看
    • 7.3 进程状态的分析
      • 7.3.1 运行状态--R
      • 7.3.2 浅度睡眠状态--S
      • 7.3.3 深度睡眠状态--D
      • 7.3.4 停止状态--T
      • 7.3.5 僵尸状态--Z
      • 7.3.6 死亡状态--X
  • 八、僵尸进程与孤儿进程
    • 8.1 僵尸进程
      • 8.1.1 僵尸进程的危害进程
    • 8.2 孤儿进程

一、冯诺依曼体系结构

  根据冯诺依曼体系结构构成的计算机,必须具有如下功能
(1)把需要的程序和数据送至计算机中。
(2)必须具有长期记忆程序、数据、中间结果及最终运算结果的能力。
(3)能够完成各种算术、逻辑运算和数据传送等数据加工处理的能力。
(4)能够按照要求将处理结果输出给用户。
  为了完成上述的功能,计算机必须具备五大基本组成部件,包括
(1)输入数据和程序的输入设备:(键盘、磁盘、网卡、显卡、话筒、摄像头等)
(2)输出处理结果的输出设备:(显示器、磁盘、网卡、显卡、音响等)
(3)记忆程序和数据的存储器:(内存)
(4)完成数据加工处理的运算器(CPU)
(5)控制程序执行的控制器(CPU)
在这里插入图片描述
  从上图的结构可以看出,当输入设备获取到数据信号后,先将其转入内存,经由CPU的处理后,返还给内存,再由输出设备接收,让用户获取到相应的信息。
  为什么冯诺依曼体系结构要多设计一个存储器,也就是内存
  在此之前先了解一下计算机的存储分级,其中寄存器离CPU最近;L1、L2、L3是对应的三级缓存;主存通常指的是内存;本地存储(硬盘)和远程存储通常指的是外设。
  存储器的特点:离CPU更近,存储容量更小、速度更快、成本更高,如主存往上的;离CPU更远的,则相反,如本地磁盘。如图是存储器存储速度的金字塔结构。

在这里插入图片描述

二、操作系统

2.1 什么是操作系统

  任何计算机系统都包含一个基本的程序集合,称为操作系统(OS)。笼统的理解,操作系统包括:

  • 内核(进程管理,内存管理,文件管理,驱动管理)
  • 其他程序(例如函数库,shell程序等)

设计OS的目的
(1)与硬件交互,管理所有的软硬件资源
(2)为用户程序(应用程序)提供一个良好的执行环境

定位
(1)在整个计算机软硬件架构中,操作系统的定位是:一款纯正的“搞管理”的软件

如何理解“管理”
(1)管理的例子
(2)描述被管理对象
(3)组织被管理对象
俗称:先描述,再组织

在这里插入图片描述
  上图就是一个计算机软硬件体系结构,操作系统也是软件
(1)描述起来,用struct结构体,软件和硬件都是这样的
(2)组织起来,用链表或者其他高效的数据结构
(3)操作系统通过驱动程序管理底层硬件
(4)在开发角度,操作系统会对外表现为一个整体,但是会暴露自己的部分接口,供上层开发使用,这部分由操作系统提供的接口叫做系统调用,其实本质就是C函数,因为Linux底层是用C语言写的。
(5)系统调用在使用上,功能比较基础,对用户的要求相对也比较高,所以有心的开发者可以对部分系统调用进行适度封装,从而形成了库。由于系统调用过于复杂,因此出现了图形化界面,shell和工具集。

2.2 操作系统的意义

总结
计算机管理硬件
(1)描述起来,用struct结构体
(2)组织起来,用链表或者其他高效的数据结构
系统调用和库函数概念
(1)在开发角度,操作系统对外会表现为一个整体,但是会暴露自己的部分接口,供上层开发使用,这部分由操作系统提供的接口及,叫做系统调用。
(2)系统调用在使用上,功能比较基础,对用户的要求相对也比较高,所以,有心的开发者可以对部分系统调用进行适度封装,从而形成库,有了库,就很有利于跟上层用户或者开发者进行二次开发。

三、进程

3.1 进程的基本概念

  课本概念:程序的一个执行实例,正在执行的程序等。
  内核观点:担当分配系统资源(CPU时间,内存)的实体。

3.2 描述进程——PCB

  进程信息被放在一个叫做进程控制块的数据结构中,可以理解为进程属性的集合。
  课本上称之为PCB(process control block),Linux操作系统下的PCB是:task_struct

3.3 进程和程序的区别

进程的组成
  进程一般由程序、数据集合和进程控制块三部分组成。
即:进程=内核数据结构(PCB)+该程序的代码+数据集合
进程和程序的区别
  程序是代码编译后的静态文件
  进程是正在运行的动态实例

3.4 task_struct-PCB的一种

  进程控制块(PCB)是描述进程的,在C++当中我们称之为面向对象,而在C语言当中我们称之为结构体,既然Linux操作系统是用C语言进行编写的,那么Linux当中的进程控制块必定是用结构体来实现的。

  • PCB实际上是对进程控制块的统称,在Linux中描述进程的结构体叫做task_struct。
  • task_struct是Linux内核的一种数据结构,它会被装载到RAM(内存)里并且包含进程的信息。

3.5 task_struct的内容分类

  task_struct就是Linux当中的进程控制块,task_struct当中主要包含以下信息:

  • 标示符:描述本进程的唯一标示符,用来区别其他进程
  • 状态:任务状态,退出代码,退出信号等。
  • 优先级:相对于其他进程的优先级
  • 程序计数器(pc):程序中即将被执行的下一条指令的地址。
  • 内存指针:包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针。
  • 上下文数据:进程执行时处理器的寄存器中的数据
  • I/O状态信息:包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。
  • 记账信息:可能包括处理器时间总和,使用的时钟总和,时间限制,记帐号等。
  • 其他信息

四、如何查看进程

4.1 通过系统文件查看进程

  在根目录下有一个名为proc的系统文件夹
在这里插入图片描述
  文件夹当中包含大量进程信息,其中有些子目录的目录名为数字
在这里插入图片描述
  这些数字其实是某一进程的PID,对应文件夹当中记录着对应进程的各种信息。我们若想查看PID为1的进程的进程信息,则查看名字为1的文件夹即可。
在这里插入图片描述

4.2 通过ps指令查看进程

  单独使用ps命令,会显示所有进程信息

[zl@VM-16-2-centos lesson12]$ ps axj

在这里插入图片描述
  ps命令与grep命令搭配使用,即可只显示某一进程的信息

[zl@VM-16-2-centos lesson11]$ ps axj | head -1 && ps axj | grep 'myproc'

在这里插入图片描述

五、如何获取pid和ppid

  想要获取到pid和ppid,就要用到系统调用接口:
pid_t getpid(void)–返回的是子进程ID
pid_t getppid(void)–返回的是父进程ID

5.1 getpid()–获取子进程(pid)

#include<stdio.h>
#include<unistd.h>
int main()
{printf("I am child pid: %d\n",getpid());return 0;
}

5.2 getppid()–获取父进程(ppid)

#include<stdio.h>
#include<unistd.h>
int main()
{printf("I am father pid: %d\n",getppid());return 0;
}

  通过系统调用函数,getpid和getppid即可分别获取进程的PID和PPID。
在这里插入图片描述
在这里插入图片描述
  我们可以通过ps命令查看该进程的信息,即可发现通过ps命令得到的进程的PID和PPID与使用系统调用函数getpid和getppid所获取的值相同。
在这里插入图片描述

六、进程的创建–fork初识

6.1 四种主要事件会导致进程的创建

(1)系统初始化
(2)正在运行的程序执行了创建程序的系统调用
(3)用户请求创建一个新进程
(4)一个批处理作业的初始化

6.2 用户如何请求创建一个新进程

  fork是一个系统调用级别的函数,其功能就是创建一个子进程
在这里插入图片描述
  若是代码当中没有fork函数,我们都知道代码的运行结果就是打印该进程的PID和PPID。而加入了fork函数后,代码运行结果如下:
在这里插入图片描述
  运行结果是打印两行数据,一行数据是该进程的PID和PPID,二行数据是代码中fork函数创建的子进程的PID和PPID。我们可以发现fork函数创建的进程的PPID就是proc进程的PID,也就是说proc进程与fork函数创建的进程之间是父子关系。
  说明:使用fork函数创建子进程后就有了两个进程,这两个进程被操作系统调度的顺序是不确定的,这取决于操作系统调度算法的具体实现。

6.3 如何让父子进程各有所需

  上面说到,fork函数创建出来的子进程与其父进程共同使用一份代码,但我们如果真的让父子进程做相同的事情,那么创建子进程就没有什么意义了。
  实际上,在fork之后我们通常使用if语句进行分流,即让父进程和子进程做不同的事。
fork函数的返回值
(1)如果子进程创建成功,在父进程中返回子进程的PID,而在子进程中返回0。
(2)如果子进程创建失败,则在父进程中返回-1。
  既然父进程和子进程获取到的fork函数的返回值不同,那么我们就可以据此来让父子进程执行不同的代码,从而做不同的事。
在这里插入图片描述
  fork创建出子进程后,子进程会进入到if语句的循环打印当中,而父进程会进入到else if语句的循环打印当中。
在这里插入图片描述

七、进程的状态

7.1 进程状态有哪些

  CPU对进程处理,取决于当前进程所处的状态,CPU对于不同状态的进程会采取不同的措施。
在这里插入图片描述  这里具体谈一下Linux操作系统中的进程状态,Linux操作系统的源代码当中对于进程状态有如下定义:

/*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] = {
"R (running)",        /* 0  */  //不可中断
"S (sleeping)",       /* 1  */  //正在运行,或在队列中的进程
"D (disk sleep)",     /* 2  */  //处于休眠状态
"T (stopped)",        /* 4  */  //停止或被追踪
"t (tracing stop)",   /* 8  */  //追踪状态,类似于vs下打断点后直接运行到断点处
"X (dead)",           /* 16 */  //死掉的进程
"Z (zombie)",         /* 32 */  //僵尸进程
};

说明:进程的当前状态是保存到自己的进程控制块(PCB)当中的,在Linux操作系统当中也就是保存在task_struct当中的。

7.2 进程状态的查看

  在Linux操作系统当中我们可以通过 ps axj命令查看进程的状态。

[zl@VM-16-2-centos lesson12]$ ps axj

在这里插入图片描述

7.3 进程状态的分析

7.3.1 运行状态–R

  一个进程处于运行状态(running),并不意味着进程一定处于运行当中,运行状态表明一个进程要么在运行中,要么在运行队列里。也就是说,可以同时存在多个R状态的进程。
  说明:所有处于运行状态,即可被调度的进程,都被放到运行队列当中,当操作系统需要切换进程运行时,就直接在运行队列中选取进程运行。

7.3.2 浅度睡眠状态–S

  一个进程处于浅度睡眠状态(sleeping),意味着该进程正在等待某件事情的完成,处于浅度睡眠状态的进程随时可以被唤醒,也可以被杀掉(用kill -9 PID进程杀掉)(这里的睡眠有时候也可叫中断睡眠(interruptible sleep))

7.3.3 深度睡眠状态–D

  一个进程处于深度睡眠状态(disk sleep),表示该进程不会被杀掉,即便是操作系统也不行,只有该进程自动唤醒才可以恢复。该状态有时候也叫不可中断睡眠状态(uninterruptible sleep),处于这个状态的进程通常会等待IO的结束。
  例如,某一进程要求对磁盘进行写入操作,那么在磁盘进行写入期间,该进程就处于深度睡眠状态,是不会被杀掉的,因为该进程需要等待磁盘的回复(是否写入成功)以做出相应的应答。(磁盘休眠状态)

7.3.4 停止状态–T

  在Linux当中,我们可以通过发送SIGSTOP信号使进程进入停止状态(stopped),发送SIGCONT信号可以让处于停止状态的进程继续运行。

7.3.5 僵尸状态–Z

  当一个进程将要退出的时候,在系统层面,该进程曾经申请的资源并不是立即被释放,而是要暂时存储一段时间,以供操作系统或是其父进程进行读取,如果退出信息一直未被读取,则相关数据是不会被释放掉的,一个进程若是正在等待其退出信息被读取,那么我们称该进程处于僵尸状态(zombie)
  首先,僵尸状态的存在是必要的,因为进程被创建的目的就是完成某项任务,那么当任务完成的时候,调用方是应该知道任务的完成情况的,所以必须存在僵尸状态,使得调用方得知任务的完成情况,以便进行相应的后续操作。

7.3.6 死亡状态–X

  死亡状态只是一个返回状态,当一个进程的退出信息被读取后,该进程所申请的资源就会立即被释放,该进程也就不存在了。所以你不会在任务列表当中看到死亡状态(dead)

八、僵尸进程与孤儿进程

8.1 僵尸进程

  前面说到,一个进程若是正在等待其退出信息被读取,那么我们称该进程处于僵尸状态。而处于僵尸状态的进程,我们就称之为僵尸进程。

8.1.1 僵尸进程的危害进程

(1)僵尸进程的退出状态必须一致维持下去,因为它要告诉其父进程相应的退出信息。可是父进程一直不读取,那么子进程也就一直处于僵尸状态。
(2)僵尸进程的退出信息被保存在task_struct(PCB)中,僵尸状态一直不退出,那么PCB就一直需要进行维护。
(3)若是一个父进程创建了很多子进程,但都不进行回收,那么就会造成资源浪费,因为数据结构对象本身就要占用内存。
(4)僵尸进程申请的资源无法进行回收,那么僵尸进程越多,实际可用的资源就越少,也就是说,僵尸进程会导致内存泄漏。

8.2 孤儿进程

  在Linux当中的进程关系大多数是父子关系,若子进程先退出而父进程没有对子进程的退出信息进行读取,那么我们称该进程为僵尸进程。但若是父进程先退出,那么将来子进程进入僵尸状态时就没有父进程对其进行处理,此时该子进程就称之为孤儿进程。
  若是一直不处理孤儿进程的退出信息,那么孤儿进程就会一直占用资源,此时就会造成内存泄漏。因此,当出现孤儿进程的时候,孤儿进程会被1号init进程领养,此后当孤儿进程进入僵尸状态时就由init进程进行处理回收。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/596731.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RobotFramework测试框架(13)--扩展RF

扩展RF 可以写Python库 Static Library 静态库中RF的关键字被定义为python的方法。 Static Library With a Class 将Python类导入为Library&#xff0c;则类中的方法可以是关键字。 class DemoLibrary:def __init__(self, *args, **kwargs):print(f"Sample Library …

opencv+python(通道的分离与合并)笔记

分割图像通道&#xff1a; 通过函数mvsplit(img)&#xff1b;mv返回的通道&#xff1b; RGB有3个通道&#xff1b;灰度图只有一个通道&#xff1b; b,g,r cv2.split(img)cv2.imshow("b",b)#通道bcv2.imshow("g",g)#通道gcv2.imshow("r",r)#通道…

Python向带有SSL/TSL认证服务器发送网络请求小实践(附并发http请求实现asyncio+aiohttp)

1. 写在前面 最近工作中遇到这样的一个场景&#xff1a;给客户发送文件的时候&#xff0c;为保证整个过程中&#xff0c;文件不会被篡改&#xff0c;需要在发送文件之间&#xff0c; 对发送的文件进行签名&#xff0c; 而整个签名系统是另外一个团队做的&#xff0c; 提供了一…

wordpress全站开发指南-面向开发者及深度用户(全中文实操)--wordpress中的著名循环

wordpress中的著名循环 首先&#xff0c;在深入研究任何代码之前&#xff0c;我们首先要确保我们有不止一篇博客文章可以工作。因此&#xff0c;我们要去自己的wordpress站点&#xff0c;从侧边栏单机Posts(文章)&#xff0c;进行创建 在执行代码的时候会优先执行single.php如…

【苍穹外卖】sql自动补全列名

第一步要设置IDEA与MySQL的链接 右侧的Database 加号 Data Source ----MySQL 填一下用户名密码就行&#xff0c;然后测试连接。可能会有时区问题&#xff0c;他让你点什么你就点 完了之后&#xff0c;他的表好像只有bank下面的那一个&#xff0c;要把所有的表都调出来&…

线程池详解并使用Go语言实现 Pool

写在前面 在线程池中存在几个概念&#xff1a;核心线程数、最大线程数、任务队列。 核心线程数指的是线程池的基本大小&#xff1b;也就是指worker的数量最大线程数指的是&#xff0c;同一时刻线程池中线程的数量最大不能超过该值&#xff1b;实际上就是指task任务的数量。任务…

Java集合——Map、Set和List总结

文章目录 一、Collection二、Map、Set、List的不同三、List1、ArrayList2、LinkedList 四、Map1、HashMap2、LinkedHashMap3、TreeMap 五、Set 一、Collection Collection 的常用方法 public boolean add(E e)&#xff1a;把给定的对象添加到当前集合中 。public void clear(…

Golang | Leetcode Golang题解之第11题盛最多水的容器

题目&#xff1a; 题解&#xff1a; func maxArea(height []int) int {res : 0L : 0R : len(height) - 1for L < R {tmp : math.Min(float64(height[L]), float64(height[R]))res int(math.Max(float64(res), tmp * float64((R - L))))if height[L] < height[R] {L} el…

微信小程序的页面交互2

一、自定义属性 &#xff08;1&#xff09;定义&#xff1a; 微信小程序中的自定义属性实际上是由data-前缀加上一个自定义属性名组成。 &#xff08;2&#xff09;如何获取自定义属性的值&#xff1f; 用到target或currentTarget对象的dataset属性可以获取数据 &#xff…

【51单片机入门记录】RTC(实时时钟)-DS1302概述

目录 一、基于三线通信的RTC-DS1302 &#xff08;1&#xff09;简介 &#xff08;2&#xff09;特性 &#xff08;3&#xff09;引脚介绍 &#xff08;4&#xff09;控制字的格式 &#xff08;5.0&#xff09;日历时钟寄存器介绍 &#xff08;5.1&#xff09;日历时钟寄存…

特别记录:chm报错

妙网生成CHM&#xff0c;一直都很好。 今天突然出现 查遍网上&#xff0c;都是提示&#xff1a; * 需要保证该文件存放的路径里边不能有“#”&#xff0c;如果有“#”就会出现这种问题 之类的一堆相同的解决方案&#xff0c;都未来解决 结果&#xff0c;经过排查&#xff0…

Spring Cloud Hoxton.SR7 Supported Boot Version: 2.3.2.RELEASE

1、地址 Spring Cloudhttps://docs.spring.io/spring-cloud/docs/Hoxton.SR7/reference/html/ 2、 截图