【Linux】进程初步理解

个人主页 : zxctscl
如有转载请先通知

文章目录

  • 1. 冯诺依曼体系结构
    • 1.1 认识冯诺依曼体系结构
    • 1.2 存储金字塔
  • 2. 操作系统
    • 2.1 概念
    • 2.2 结构
    • 2.3 操作系统的管理
  • 3. 进程
    • 3.1 进程描述
    • 3.2 Linux下的PCB
  • 4. task_struct本身内部属性
    • 4.1 启动
    • 4.2 进程的创建方式
      • 4.2.1 父子进程
      • 4.2.2 fork
      • 4.2.3 一次创建多个进程

1. 冯诺依曼体系结构

1.1 认识冯诺依曼体系结构

电脑里面的硬件不是随便就能构成计算机,这些硬件是按照一定的规则去组装电脑的。
计算机的核心工作就是通过一定的输入设备,把数据交给计算机cpu,而cpu经过一定的设备再显示出结果。
计算机的构成遵循冯诺依曼体系结构:
在这里插入图片描述
输入设备:键盘、鼠标、摄像头、话筒、磁盘、网卡…
输出设备:显示器、声卡、磁盘、网卡
中央处理器(CPU):运算器、控制器
存储器:内存
设备是互相连接的。

数据是要在计算机体系结构中进行流动的,流动的过程中,进行数据的加工处理。
从一个设备到另一个设备,本质是一种拷贝。

中央处理器的运算速度特别快,如果用户想要计算机处理数据,计算机就得在整个体系的各种设备之间拷贝各种数据,还CPU得进行运算。CPU处理速度很快所以它并不是影响计算机整体效率的矛盾。而是数据设备间拷贝的效率,决定了计算机整体的基本效率。

1.2 存储金字塔

在这里插入图片描述
存储:距离CPU越近的,效率越高,成本越高

计算机为什么要有存储器?
在这里插入图片描述
如果没有存储器。
输入设备效率非常低,CPU非常快,它们两个的速度差非常大。根据木桶原理,输入设备拷贝数据到CPU非常慢,CPU的大部分时间就是在等待数据;同时CPU想要输出,从CPU里面数据拷贝到输出设备速度又非常慢,所以整个计算机的效率是输入输出设备的效率,就不能采取这样的方案。
所以就加了个内存,可以预先在内存里面加载大量的数据,从此CPU就在内存里面读数据,CPU在处理数据时,同时可以将输入设备的数据拷贝到内存里面。这样整体的效率取决于输入输出设备就变成了取决于存储器了。

存储器就相当于输入输出和CPU之间的一个巨大的缓存。

冯诺依曼体系结构不仅仅是提高了计算机的效率,还并没有将计算机的成本提高多少。
在这里插入图片描述

在硬件数据流动角度,在数据层面:

  1. CPU不和外设直接打交道,CPU只和内存打交道。
  2. 外设(输入和输出)的数据,不是直接给CPU的,而是先放入内存中。

那么冯诺依曼体系结构能干什么?
程序运行,要先加载到内存。
程序=代码+数据。程序的数据要被CPU访问。
程序没有被加载在内存的时候在磁盘里面,就是一个二进制文件。磁盘就是外设,CPU不能直接从外设直接读取代码和数据,只能通过内存来读取,这个就是冯诺依曼体系结构规定了必须这么做。
在这里插入图片描述
对冯诺依曼的理解,不能停留在概念上,要深入到对软件数据流理解上,解释一下,从你登录上qq开始和某位朋友聊天开始,数据的流动过程。 从你打开窗口,开始给他发消息,到他的到消息之后的数据流动过程。
我这边是电脑,朋友那边也是电脑,本质上就是两台冯诺依曼体系。
我是通过键盘输入了一个消息假设是“你好”,那么“你好”必须得在内存里,就是我们在电脑上登录的时候QQ已经加载到内存里了。而“你好”要发到朋友那里就得先经过加密,加密就得通过CPU,然后再到输出设备,而要实现消息传输就需要网络,能和网络打交道的就是输出设备里面的网卡。数据经过网路就能到达朋友那边。
到朋友电脑那边,被朋友收到的输入设备肯定也是网卡,然后这个数据就传到内存里,而QQ要做解密的操作,所以数据得加载到CPU中,消息解密得到“你好”,再写到内存中,然后再把消息刷新到输出设备显示器上。
在这里插入图片描述

2. 操作系统

2.1 概念

操作系统是一款进行软硬件资源管理的软件
操作系统广义的认识:操作系统的内核+操作系统的外壳周边程序,这里的外壳周边程序指的是给用户提供使用操作系统的方式。
操作系统狭义的认识:只是操作系统的内核。

2.2 结构

如果操作系统要直接把硬件管理好,前提是得有通信,所以操作系统得访问到硬件,可、是每一种硬件的物理特性是不一样的,如果直接由操作系统来直接访问下面的这些硬件,如果硬件的物理特性发生了变化,还得去改操作系统。
在这里插入图片描述
所以就不能操作系统就不能直接管理硬件,这里就在它们两个之间多了一个软件层:
在这里插入图片描述
每一种硬件都有自己对应的驱动程序,驱动器层主要负责向操作系统提供一些通信接口,让操作系统直接提供驱动层访问到硬件。一般这里的驱动层的软件代码都是由厂商自定义的。

这个结构就叫做:体系结构的层状划分
在这里插入图片描述

为什么要有操作系统?
对软硬件资源进行管理(手段),为用户提供一个良好(稳定的、安全的、高效的)的运行环境

2.3 操作系统的管理

日常生活中我们做事情离不开决策和执行。
举个例子:在学校里面,学生是被管理者,校长就是真正意义上的管理者,但是校长并不是直接来管理学生,而是通过辅导员,可能到毕业有的学生都没有见过校长。所以说一个学校被管理好,不需要管理者和被管理者直接接触。
那么是如何管理的?
拿到学生的数据才是目的,管理学生,本质就是对学生数据进行管理。

对于任何管理都是:先描述,在组织
凡是要对待特定的对象进行管理也是先描述,在组织

在这里插入图片描述

作为用户是不能直接绕过操作系统来直接访问底层硬件,任何要访问硬件的操作必须通过操作系统来做。
在这里插入图片描述
如果用户想要访问操作系统里面某一部分软硬件资源的数据,怎么怎么访问?
举个例子:在银行如果想要存钱,不可能允许用户直接进入仓库里面直接存钱,而又必须给用户提供对应的业务,所以银行就提供了柜台来提供业务,用户通过柜台来存取钱。
和银行的方式一样,操作系统为用户提供一个软件层,叫做系统调用。
在这里插入图片描述

用户要访问操作系统,必须使用系统调用的方式,使用操作系统。

在开发角度,操作系统对外会表现为一个整体,但是会暴露自己的部分接口,供上层开发使用,这部分由操作系统提供的接口,叫做系统调用
系统调用在使用上,功能比较基础,对用户的要求相对也比较高,所以,有心的开发者可以对部分系统调用进行适度封装,从而形成库,有了库,就很有利于更上层用户或者开发者进行二次开发。

3. 进程

3.1 进程描述

概念:程序的一个执行实例,正在执行的程序等。

把可执行程序的代码和数据加载到内存里,不是进程,只是进程对应的代码和数据。
某一个进程都会有一个struct PCB,它里面包含进程对应的所有属性,还有内存指针。
一个进程一个PCB。把所有进程用struct PCB* next指针连接,管理起来,所以对进程的管理,就变成了对链表的增删改查。
进程=PCB+自己的代码和数据
所以对进程的管理就转化为对PCB的管理,不是直接对程序进行管理。

为什么要有PCB?
操作系统要对进程管理,就得先描述,在组织。

3.2 Linux下的PCB

进程=PCB+自己的代码和数据
在Linux下PCB具体的数据结构叫struct task struct,就是进程控制块。

PCB是Linux下的统称
struct task struct是具体的称呼。

在这里插入图片描述
操作系统为了管理程序的代码和数据,会创建进程控制块task_struct,包含了进程的所有属性,并且执行自己的代码和数据。在操作系统中可能会同时存在很多进程控制块,所以用链表把它们链接起来。CPU想要调度进程,在操作系统里面维护一个队列数据结构task_queue。将来CPU要调度的时候,就在task_queue里面选择进程去调度。想要让进程运行起来,就会让进程在操作系统里面排队,是task_struct去进行排队。

所以操作系统调度运行进程,本质就是让进程控制块task_struct进行排队。

所以可以把进程理解为:
进程=内核task_struct结构体+程序的代码和数据

如何理解进程的动态运行?
只要我们进程的task_struct将来在不同的队列中,进程就可以访问不同的资源。

4. task_struct本身内部属性

4.1 启动

先用C语言简单的写一个测试代码:

Makefile:

  1 myprocess:myprocess.c2   gcc -o $@ $^3 .PHONY:clean4 clean:5   rm -f myprocess

myprocess.c:

  1 #include<stdio.h>2 #include<unistd.h>34 int main()5 {6   while(1)7   {8     printf("I am a process!\n");9     sleep(1);10   }11 }

make编译一下:
在这里插入图片描述

这里形成的myprocess就是可执行程序,编译形成二进制可执行文件,是文件,就在Linux的磁盘中存放。

./myprocess把它运行起来,此时它已然变成了一个进程:
在这里插入图片描述
在这里插入图片描述

所有系统提供的命令都是executable, x86-64下的可执行程序:
在这里插入图片描述

所以:./XXX本质就是让系统创建进程并运行,我们自己写的代码形成的可执行==系统命令==可执行文件。在Linux中运行的大部分执行操作,本质都是运行进程
在这里插入图片描述

查看系统当前所对应进程的详细详细:

ps axj

就能查看到系统中所有启动的进程
在这里插入图片描述

要想只查看到myprocess,就得使用命令:

ps axj | grep myprocess

此时就出来了:
在这里插入图片描述
为什么会出现grep?
在这里插入图片描述
grep在过滤时,确实找到了myprocess,但是grep启动也变成了一个进程,事宜查的时候出来myprocess被查到了,grep本身也被查到了。

使用命令:

 ps axj | head -1

就可以知道第一行每一个部分的属性信息。
在这里插入图片描述

想要属性信息和上面的查询进程对应起来,就用&&把两条命令连接起来:

ps axj | head -1 && ps axj | grep myprocess

这样就可以了:
在这里插入图片描述

每一个进程的都要有自己唯一的标识符,叫做进程pid
在这里插入图片描述
也就是说在task_struct本身内部有一个unsigned int pid。
在这里插入图片描述
一个进程怎么知道自己的pid?
task_struct是操作系统的内核数据结构,用户不能直接去访问来找到自己的pid信息,所以操作系统必须得提供系统调用,系统提供的是getpid:
在这里插入图片描述
那么在代码里面加上查询pid的信息:

  1 #include<stdio.h>2 #include<unistd.h>3 #include<sys/types.h>4 #include<unistd.h>56 int main()7 {8   pid_t id=getpid();910   while(1)11   {12     printf("I am a process,pid:%d\n",id);13     sleep(1);14   }15 }

编译运行之后:就看见
在这里插入图片描述
用系统来查一下,发现pid是一样的:
在这里插入图片描述
在这里插入图片描述
进程一直跑,可以用ctrl+c来终止进程
在这里插入图片描述
ctrl+c就是在用户层面终止进程

还有其他方法干掉进程吗?
用命令:kill -9+pid
来看个例子:
在这里插入图片描述
kill -9+pid可以直接杀掉进程

4.2 进程的创建方式

4.2.1 父子进程

pid_t getppid(void)获得当前进程的父进程id
在代码里面加上获取父进程ip的代码:

  1 #include<stdio.h>2 #include<unistd.h>3 #include<sys/types.h>4 #include<unistd.h>56 int main()7 {8   pid_t id=getpid();9   pid_t parent=getppid();10   while(1)11   {12     printf("I am a process,pid:%d,ppid:%d\n",id,parent);13     sleep(1);14   }15 }

此时就能够查到ppid:
在这里插入图片描述

为了方便观察写了一个shell命令,每个一秒钟来周期性执行一下中间的命令:

 while :;do ps axj | head -1 && ps axj | grep myprocess;sleep 1;done

这样每个一秒就能查到当前进程的情况:
在这里插入图片描述

发现每一次启动进程的时候它的pid都不一样,但是它的父进程id都是一样的:
在这里插入图片描述
进程每次启动,对应的pid都是不一样的,是正常的。

查一下ppid:发现有bash
在这里插入图片描述
bash就是父进程,就是命令行解释器。

4.2.2 fork

创建进程,就得提供系统调用,用到的是fork:
在这里插入图片描述
来简单先使用一下fork:

  1 #include<stdio.h>2 #include<unistd.h>3 #include<sys/types.h>4 #include<unistd.h>5 6 int main()7 {8   printf("process is running,only me!\n");9   fork();10   printf("hello world\n");11   sleep(1);12 13 }

fork()执行完之后应该有两个执行流,默认各自执行后面的代码。

为了方便查看把含grep的信息去掉

 while :;do ps axj | head -1 && ps axj | grep myprocess | grep -v grep;sleep 1;done

在这里插入图片描述
13840的父进程id是13798,他们两个是父子关系:
在这里插入图片描述
fork之后,父子代码共享
创建一个进程,本质就是系统中多一个进程,多一个进程,就是多一个内核task_struct,多了的进程有自己的代码和数据。

父进程的代码和数据是从磁盘来的,子进程的代码和数据默认情况下,继承父进程的代码和数据。

在这里插入图片描述
将代码重新修改,让代码在调用过程中显示出进程对应的pid和ppid:

  1 #include<stdio.h>2 #include<unistd.h>3 #include<sys/types.h>4 #include<unistd.h>56 int main()7 {8   printf("process is running,only me!,pid:%d\n",getpid());9   sleep(3);10   fork();11   printf("hello world,pid:%d,ppid:%d\n",getpid(),getppid());12   sleep(5);13 14 }

从显示结果来看,创建了子进程:
在这里插入图片描述
在这里插入图片描述
为什么要创建子进程?
主要是想要子进程执行和父进程不一样的代码。

fork:如果fork成功就返回子进程的pid给父进程,返回0给子进程;失败了就返回-1:
在这里插入图片描述
fork会返回两次,每次的返回值不一样。

想要父子进程执行不同的代码,把代码修改一下:

  1 #include<stdio.h>2 #include<unistd.h>3 #include<sys/types.h>4 #include<unistd.h>5 6 int main()7 {8   printf("process is running,only me!,pid:%d\n",getpid());9   sleep(3);10   pid_t id=fork();11   if(id==-1)return 1;12   else if(id==0)13   {14     //child15     while(1)16     {17         printf("id:%d,I am child process,pid:%d,ppid:%d\n",id,getpid(),getppid());18         sleep(1);19     }20   }21   else22   {23     //parent24     while(1)25     {26         printf("id:%d,I am parent process,pid:%d,ppid:%d\n",id,getpid(),getppid());27         sleep(2);28     }29   }30 3132 }

在这里插入图片描述
在这里插入图片描述
输出消息中返回值是0,就是子进程,刚好匹配:
在这里插入图片描述

fork之后的代码父子进程是共享的,只不过等于id=0是给子进程的,id=子进程pid是给父进程的。
只是做了判断,子进程才进入到满足条件的代码中;而父进程进入父进程有关代码中,从而实现了父子进程同时跑。

在之前学习的代码都是单进程,不可能有多个if里面的代码同时运行。
而这里是多进程,就会出现多个满足if条件的代码同时执行。

那么为什么同一个id,既是等于0又是大于0?
这个和虚拟地址空间有关系。进程具有独立性,而父子进程各自独立,所以它们有各自的pid,而代码是只读的,不能修改。而数据在父子进程上是分开的。

fork会有两个返回值,返回两次。
fork是操作系统提供的,当一个函数执行到return时候,函数的核心工作已经做完了。
那么说明fork的时候子进程就已经存在了。父进程运行一次执行一次return;子进程运行一次执行一次return。那么就会return两次。

在这里插入图片描述
单独kill掉父进程或者子进程,不会影响另一个的运行。
在这里插入图片描述

4.2.3 一次创建多个进程

  1 #include<stdio.h>2 #include<unistd.h>3 #include<sys/types.h>4 #include<unistd.h>56 void RunChild()7 {8   while(1)9   {10     printf("I am child process,pid:%d,ppid:%d\n",getpid(),getppid());11   }12 }13 int main()14 {15    const int num=5;16    int i;17    for(i=0;i<num;i++)18    {19      pid_t id=fork();20      if(id==0)21      {22        RunChild();23      }24      sleep(1);25    }2627    while(1)28    {29      printf("I am parent,pid:%d,ppid:%d\n",getpid(),getppid());30    }31}

在这里插入图片描述
task_ struct内容分类:

  1. 标示符:描述本进程的唯一标示符,用来区别其他进程。
  2. 状态:任务状态,退出代码,退出信号等。
  3. 优先级:相对于其他进程的优先级。
  4. 程序计数器:程序中即将被执行的下一条指令的地址。
  5. 内存指针:包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
  6. 上下文数据:进程执行时处理器的寄存器中的数据[休学例子,要加图CPU,寄存器]。
  7. I/O状态信息:包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。
  8. 记账信息:可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。
  9. 其他信息

在这里插入图片描述
查看进程:
进程的信息可以通过/proc系统文件夹查看
在这里插入图片描述
在这里插入图片描述

进程的pcb中会记录自己对应的可执行程序的路径。
每个进程在启动的时候,会记录自己当前在那个路径下启动,进程的当前路径
在这里插入图片描述

有问题请指出,大家一起进步!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/595923.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024.4.5-[作业记录]-day10-CSS 布局模型(层模型)

个人主页&#xff1a;学习前端的小z 个人专栏&#xff1a;HTML5和CSS3悦读 本专栏旨在分享记录每日学习的前端知识和学习笔记的归纳总结&#xff0c;欢迎大家在评论区交流讨论&#xff01; 文章目录 作业 2024.4.5-学习笔记1 CSS定位1.1 相对定位 relative1.2 绝对定位 absolut…

MATLAB实现数值求解高阶常微分方程组

一、高阶常微分方程组 高阶常微分方程是指包含多个高阶常微分方程的系统。这些方程通常涉及多个未知函数及其高阶导数。解决高阶常微分方程组通常比解决单个高阶常微分方程更为复杂&#xff0c;因为需要同时考虑多个方程和多个未知函数之间的关系。 一般来说&#xff0c;解决…

分类预测 | Matlab实现TCN-BiGRU-Mutilhead-Attention时间卷积双向门控循环单元多头注意力机制多特征分类预测/故障识别

分类预测 | Matlab实现TCN-BiGRU-Mutilhead-Attention时间卷积双向门控循环单元多头注意力机制多特征分类预测/故障识别 目录 分类预测 | Matlab实现TCN-BiGRU-Mutilhead-Attention时间卷积双向门控循环单元多头注意力机制多特征分类预测/故障识别分类效果基本介绍模型描述程序…

电商-广告投放效果分析(KMeans聚类、数据分析-pyhton数据分析

电商-广告投放效果分析&#xff08;KMeans聚类、数据分析&#xff09; 文章目录 电商-广告投放效果分析&#xff08;KMeans聚类、数据分析&#xff09;项目介绍数据数据维度概况数据13个维度介绍 导入库&#xff0c;加载数据数据审查相关性分析数据处理建立模型聚类结果特征分析…

网站SSL证书是什么?有什么用处?

SSL证书是一种数字证书&#xff0c;主要用于保障互联网通信过程中的信息安全&#xff0c;特别是涉及敏感信息&#xff08;如个人身份、金融交易数据、登录凭据等&#xff09;的在线传输。以下是对SSL证书从原理、作用等方面进行的简单介绍&#xff1a; 原理&#xff1a; 1. 公…

WordPress建站教程:10步快速搭建个人网站

WordPress是一个广泛使用的内容管理系统&#xff08;CMS&#xff09;&#xff0c;凭借其用户友好的界面和大量可定制的主题和插件&#xff0c;为WordPress 提供了多功能性和灵活性&#xff0c;可用于创建各种类型的网站&#xff0c;包括个人博客、B2B企业网站、B2C外贸网站等&a…

python小练习(ps:可评论区讨论)

1. (单选题)海龟初始坐标为&#xff08;0&#xff0c;0&#xff09;&#xff0c;让海龟往坐标原点后方移动200像素的语句是 A. turtle.penup(200)B. turtle.fd(200)C. turtle.goto(200)D. turtle.bk(200) 2. (单选题)改变海龟画笔尺寸的是 A. turtle.penwidth()B. turtle.pen…

接口和抽象类的综合案例

题目要求&#xff1a; 代码框架&#xff1a; 代码实现&#xff1a; person类&#xff1a; package www.jsu.com;public class Person {private String name;private int age;public Person() {}public Person(String name, int age) {this.name name;this.age age;}public …

C++ | Leetcode C++题解之第12题整数转罗马数字

题目&#xff1a; 题解&#xff1a; const string thousands[] {"", "M", "MM", "MMM"}; const string hundreds[] {"", "C", "CC", "CCC", "CD", "D", "DC&qu…

嵌入式系统初学者指南

什么是嵌入式系统&#xff1f; 嵌入式系统是一种独立的、基于微处理器的计算机系统。您可以将其视为大型系统的一部分的微型计算机。如今&#xff0c;从洗碗机到波音 747&#xff0c;几乎所有“电子”产品内部都有嵌入式系统。但是&#xff0c;嵌入式系统与笔记本电脑或手机不…

Minikube本地搭建单节点Kubernetes集群

1、什么是 Minikube Minikube 是一个开源工具&#xff0c;旨在为开发者提供一种便捷的方式在本地环境中搭建单节点的 Kubernetes 集群。它主要用于开发、测试和学习 Kubernetes 应用程序&#xff0c;无需依赖大型的硬件资源或复杂的多节点集群配置。minikube 使用轻量级虚拟化技…

ES10 学习

文章目录 1. Object.fromEntries()2. trimStart() 和 trimEnd()3. 数组的flat() 和flatMap()4. Symbol 对象的description 属性5. try ... catch(e){} 1. Object.fromEntries() Object.fromEntries() 方法允许你轻松地将键 值对列表转换为对象 let arr [["name",&qu…