内存管理(mmu)/内存分配原理/多级页表

1.为什么要做内存管理?

随着进程对内存需求的扩大,和同时调度的进程增加,内存是比较瓶颈的资源,如何更好的高效的利于存储资源是一个重要问题。

这个内存管理的需求也是慢慢发展而来,早期总线上的master是直接使用物理地址,再到发展出对CPU进行内存管理的MMU,到现在给SOC内部的各个具有DMA功能的模块进行内存管理的IOMMU或者叫做SMMU

在没有内存管理的时代,物理空间只能连续的使用,一个进程要用多少存储,在进程开始就确定好了,但是进程在运行过程中由于程序局部性的原理,在一段时间内可能只使用了分配好的内存的一部分,其余大部分时间都是空闲的;另外一个问题就是在分配内存过程中会出现一些小的且不连续的内存空间,这些空间(内存碎片)无法满足任何进程的使用,造成了一定的空间浪费。

所以内存管理解决的就是就是两个问题:

  • 让进程在运行过程中动态分配存储空间,即根据需求在运行过程中不断的分配空间【这同时促进了多级页表的产生】,而不需要一次分配很大的空间,这样可以提高进程并行调度能力
  • 降低空间碎片的产生

内存管理采用虚拟地址到物理地址的映射,这种用虚拟空间来隔离进程的做法又促进了虚拟化/虚拟机【VM】的发展,本文先不讨论VM。

1.1 内存碎片

内存碎片是由内存的申请和释放产生的,通常分为内部碎片和外部碎片。

  1. 内部碎片是由于采用固定大小的内存分区,即以固定的大小块为单位来分配,采用这种方法,进程所分配的内存可能会比所需要的大,这多余的部分便是内部碎片。
  2. 外部碎片是由于未分配的连续内存区域太小,以至于不能满足任意进程所需要的内存分配请求,这些小片段且不连续的内存空间被称为外部碎片。

2.内存管理算法

linux每一个用户进程都对应有自己的页表,我们不禁要问这些页表或者说物理空间是如何分配的?为什么每个进程对应一个页表?

通俗的来讲,每一个用户进程看到的都是一样大小的虚拟空间,所以它们并不知道实际可用的物理地址有哪些。【物理地址空间的管理和分配是一个独立于这些用户进程的,实际是OS操作系统管理的】当运行一个新的进程时,OS根据当前可用的PA【OS知道哪些PA正在被使用】,建立VA到PA的映射,也就是产生一个新的对应该进程的页表【每一个进程运行时当前可用PA都是不一样的,所以每个进程都要自己的页表】。

2.1内存管理的伙伴系统算法

linux使用的时伙伴系统来管理和分配内存

  • Linux内核使用二进制伙伴算法来管理和分配物理内存页面, 该算法由Knowlton设计, 后来Knuth又进行了更深刻的描述.
  • 伙伴系统是一个结合了2幂次个分配器和空闲缓冲区合并计技术的内存分配方案, 其基本思想很简单. 内存被分成含有很多页面的大块, 每一块都是2^n个页面大小. 如果找不到想要的块, 一个大块会被分成两部分, 这两部分彼此就成为伙伴. 其中一半被用来分配, 而另一半则空闲. 这些块在以后分配的过程中会继续被二分直至产生一个所需大小的块. 当一个块被最终释放时, 其伙伴将被检测出来, 如果伙伴也空闲则合并两者.

具体的算法请参考本人的转载文章:

内存管理之伙伴系统分析-CSDN博客

3.多级页表及节省内存

页表:是存储PTE的一个内存分页,而PTE是描述VA与PA映射关系的entry。

多级页表结构分为PGD/PUD/PMD/PTE这几个层级,P代表page,G代表global,D代表目录(Director),U代表上级,M代表中间,T代表Table,E代表Entry,所以:

PGD:page global director

PUD:page upper director

PMD:page middle director

PTE:page table entry

PTE是页表项。他们之间的关系是层级结构,通过PGD访问到最低端的PTE,访问方式是上一层地址+偏移量(offset)。PTE+页内偏移量可以访问到具体的物理地址。

为什么要建立多级页表的结构呢?

先给出结论【经过确认的结论】就是多级页表是为了节省页表的存储空间。

举个例子,4GB的DDR空间,4KB的页大小,一个PTM 4B,总共需要4GB/4K=1M个PTE,如果每个进程都要产生并存储一个1Mx4B的PTE,就会占用不少内存空间。

只要进程需要寻址4GB内存空间的能力,无论建立多少级的页表,最终都需要1Mx4B的PTE,在加上多出来的几级页表存储空间只会更多,那么为什么会说多级页表可以节省内存空间呢?

在这里先做一个统一,最底层的PTE这一级我们叫做第一级,PMD,PUD,PGD分别是第二/三/四级【这里PMD/PUD只是一个相对的层级,可能代表有多个中间层和上层,也可能没有,这里假设每一个就代表一层】,这样最底层为底层的话,无论增加多少层它的叫法不变。

写到这里有一个问题:页表既然是存在内存中的,那么有没有为页表空间建立页表?

其实多级页表可以理解为对上级页表对下级页表建立的页表,比如只有两级页表,配置了第二级页表的基地址,我们可以用虚拟地址的高位来映射第一级页表的物理地址。这样就可以理解高层页表是为了底层页表能够不连续的存储

多级页表的好处是可以将PTE分散存储,而不是用连续的物理地址存储。即使只有一级的PTE页表,也可以根据程序运行的局部特性只在特定时刻生成一部分PTE页表,但关键不在于只生成一部分的PTE,而是只有一级页表的话需要连续物理地址空间,即使只生成一部分的PTE,这1Mx4B的地址空间也不能给别人用。【这一原因也是很多文章没有说清楚的地方

另外多级页表还有一个优势,就是可以将那些不常用的低级页表swap out到硬盘中,当进程再次访问到该页表映射的物理内存是,内核将页表从硬盘中swap in到内存中。当然最顶层的PGD页表是必须常驻内存的。

既然多级页表也是存储在DDR的页上的数据,那么和其他数据一样就可以经过cache来高速缓存,其对应的高速缓存cache就是TLB(translation lookaside buffer,转换后备缓冲区,又常被称为快表)。这里不在详细介绍。

总结起来多级页表能够节省内存空间的原因如下:

  • 将页表变为非连续存储,同时可以只生成当前需要的一段页表
  • 可以将不常用页表swap到硬盘

参考资料:

操作系统中的多级页表到底是为了解决什么问题? - 知乎

该问题的答主中bin的技术小屋的回答

4.程序的局部性原理

多次提到程序的局部性原理,如何来描述呢?

局部性原理表现为:时间局部性和空间局部性。时间局部性是指如果程序中的某条指令一旦执行,则不久之后该指令可能再次被执行;如果某块数据被访问,则不久之后该数据可能再次被访问;空间局部性是指一旦程序访问了某个存储单元,则不久之后,其附近的存储单元也将被访问。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/433257.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【大数据】Flink 中的事件时间处理

Flink 中的事件时间处理 1.时间戳2.水位线3.水位线传播和事件时间4.时间戳分配和水位线生成 在之前的博客中,我们强调了时间语义对于流处理应用的重要性并解释了 处理时间 和 事件时间 的差异。虽然处理时间是基于处理机器的本地时间,相对容易理解&#…

scoped属性和深度选择器

在Vue单文件组件(SFC)中,为了防止样式全局污染,可以给 所有的scoped的css编译出来都会变成.class[哈希值]的形式 我们只能修改带data-v-0dca3a9a作用域的样式,像是 如果修改el-table的宽度 .el-table {width: 60…

MYSQL实现分组排名和不分组排名(函数RANK,DENSE_RANK和ROW_NUMBER)

目录 1. 排名分类1.1 区别RANK,DENSE_RANK和ROW_NUMBER1.2 分组排名 2. 准备数据3. 不分组排名3.1 连续排名3.2 并列跳跃排名3.3 并列连续排名 4. 分组排名4.1 分组连续排名4.2 分组并列跳跃排名4.3 分组并列连续排名 1. 排名分类 1.1 区别RANK,DENSE_R…

Elasticsearch8.11集群部署

集群就是多个node统一对外提供服务,避免单机故障带来的服务中断,保证了服务的高可用,也因为多台节点协同运作,提高了集群服务的计算能力和吞吐量。ES是一个去中心化的集群,操作一个节点和操作一个集群是一样的&#xf…

大文件传输之以太网UDP传输延迟解决方案

在数字化浪潮席卷全球的今天,数据已成为企业最宝贵的资产之一。随着企业规模的扩大和业务的全球化,大文件传输的需求日益增长,它不仅关系到企业内部数据的高效管理,也是与外部合作伙伴进行有效沟通的关键。然而,大文件…

万字长文:深度学习如何入门?

深度学习是一种强大的机器学习方法,它在各个领域都有广泛应用。如果你是一个新手,想要入门深度学习,下面是一些步骤和资源,可以帮助你开始学习和实践深度学习。 1. 学习基本概念 在开始深度学习之前,你需要对一些基本…

前端工程化之:webpack1-6(编译过程)

一、webpack编译过程 webpack 的作用是将源代码编译(构建、打包)成最终代码。 整个过程大致分为三个步骤: 初始化编译输出 1.初始化 初始化时我们运行的命令 webpack 为核心包, webpack-cli 提供了 webpack 命令,通过…

《动手学深度学习(PyTorch版)》笔记4.1

注:书中对代码的讲解并不详细,本文对很多细节做了详细注释。另外,书上的源代码是在Jupyter Notebook上运行的,较为分散,本文将代码集中起来,并加以完善,全部用vscode在python 3.9.18下测试通过。…

node学习过程中的终端命令

冷的哥们手真tm冷,打字都是僵的,屮 目录 一、在学习nodejs过程中用到的终端命令总结 一、在学习nodejs过程中用到的终端命令 node -v nvm install 20.11.0 nvm list nvm list available nvm on nvm -v nvm use 20.11.0 node加要运行的js文件路径 ps&a…

OSPF协议LSDB同步过程和邻居状态机

知识改变命运,技术就是要分享,有问题随时联系,免费答疑,欢迎联系! 厦门微思网络​​​​​​ https://www.xmws.cn 华为认证\华为HCIA-Datacom\华为HCIP-Datacom\华为HCIE-Datacom Linux\RHCE\RHCE 9.0\RHCA\ Oracle O…

前端工程化之:CSS工程化+Less

一、什么是Less? Less官网 Less中文网 Less 是一种更加简洁的样式代码,它非常像 CSS ,但又不太一样,它让编写样式变得更容易。 Less 代码虽好,但它无法被浏览器识别,因此需要一个工具将其转换为纯正的 CS…

鸿蒙开发(Harmonyos兼容与Harmonyos适配)

布局的实现 Layout_ability_main.xml布局&#xff1a; <?xml version"1.0" encoding"utf-8"?> <DirectionalLayoutxmlns:ohos"http://schemas.huawei.com/res/ohos"ohos:height"match_parent"ohos:width"match_pare…