《深入理解计算机系统》学习笔记 - 第七课 - 机器级别的程序三

Lecture 07 Machine Level Programming III Procedures 机器级别的程序三

文章目录

  • Lecture 07 Machine Level Programming III Procedures 机器级别的程序三
    • 概述
      • 程序机制
    • 栈结构
      • 栈说明
      • 栈定义
      • 推入数据
      • 弹出数据
    • 调用控制
      • 代码示例
        • 程序控制流程
          • %rip
      • 传递数据
        • ABI 标准
        • 示例
    • 管理局部数据
      • 基于堆栈的语言
      • 栈帧
      • 函数递归调用示例
      • linux 栈帧
        • 示例
    • 寄存器保存数据惯例
      • linux寄存器的使用
    • 递归说明
      • 对于递归的观察
    • 《深入理解计算机系统》书籍学习笔记

概述

本章所说的程序/过程(procedure),它即可以是函数过程,也可以是面向对象编程中的方法,这些大致相同的东西,我们统一使用术语程序(procedure)来称呼。

ABI: Application Binary Interface, 应用程序二进制接口。
它要求所有Linux程序,所有的编译器,所有的操作系统,系统的所有不同部分,都需要对如何管理机器上的资源有一些共同的理解,并共同遵守这套规则。
因此,它超越了硬件实际提供的软件标准。
它是机器程序级别的接口。

程序机制

  • 传递控制
    • 程序(函数)代码的开始
    • 返回点
  • 传递数据
    • 程序参数
    • 返回值
  • 内存管理
    • 程序运行时分配内存空间
    • 返回时解除分配
      在这里插入图片描述

传递控制:我们需要将控制权转移给一个函数并确保它能返回正确的位置。
当P调用Q时,程序必须以某种方式跳转到Q中,并开始执行Q的代码。然后当Q执行到它的退出点,程序需要以某种方式回到P。
不是返回到P的任何地方都可以,必须恰好在P调用Q后的位置。
因此为了返回正确的位置,我们需要记录返回位置的信息。

传递参数:我们如何传递参数?
Q是一个函数,它接受单个参数i并能在函数内部使用这个参数,在P调用它的地方,P给Q传递了一个称为x的值,所以x的值必须以某种形式记录下来,使的在Q内,程序有权访问其他信息。
类似的,当Q想要返回有一个值时,P也将用相同的方式利用该值。

函数中的局部数据:需要分配一些空间
那么在哪里分配这些空间?如何确保正确分配?如何确保空间被正确释放?

将程序分解成更小的函数,尽可能减少过程调用的开销。
在好的编程风格中,你写的函数往往专注于很小的功能。

设计者的原则之一是:只做绝对必要的事情
如果数据不需要本地存储空间则不要分配和释放空间了。
如果你没有必要传递任何值,那就不要传递它们。

栈结构

栈说明

前景问题:如何将控制传递给一个函数? 栈
栈并不是什么特殊的内存,栈并不是特殊的内存,它只不过是普通内存的一个区域。
对于汇编层面的程序员而言,内存只是一个巨大的字节数组。在那一堆自己中的某个地方,我们将其称为栈。

程序用栈来管理过程与返回的状态。
在栈中,程序传递潜在信息,控制信息和数据,并分配本地数据。栈可以用于管理这些信息的原因在于栈这种数据结构,符合过程调用和返回的整个想法的实质。
当你调用时,可能需要一些信息,但是当你从调用中返回时,所有这些信息可以被丢弃,因此它利用了栈的那种后进先出的原则,这与调用与返回的思想十分吻合。

栈定义

  • 用栈规则管理内存区域。
  • 向较低地址增长
  • 寄存器%rsp 包含最低栈地址。也就是最上面的元素(最先出栈的元素)
    在这里插入图片描述

每次在栈上分配更多空间时,都会通过递减该指针来实现。

推入数据

pushq Src

  • 从Src获取操作数
  • 寄存器%rsp 减8
  • 将数据写入寄存器%rsp 给的地址。

弹出数据

popq Dest

  • 从寄存器%rsp中读取数据
  • 寄存器%rsp地址 加8
  • 将值存到Dest(必须是寄存器)

拓展:
弹出数据之后,寄存器%rsp地址加8,增加栈指针来释放空间,并不意味着我神奇的抹去了什么,仅仅移动了栈指针而已,原来的栈顶元素热然保存在内存中,只是不再时栈中的一部分了。

调用控制

指令call与ret使用了栈push与pop相同的思想。

代码示例

  • c 语言代码
long mult2(long a, long b)
{long s = a * b;return s;
}void multstore(long x,long y,long *dest)
{long t = mult2(x, y);*dest = t;
}
  • 汇编码
0000000000400540 <multstore>:400540: push   %rbx		# Save %rbx400541: mov    %rdx,%rbx		# Save dest400544: callq  400550 <mult2>	# mult2(x,y)400549: mov    %rax,(%rbx)	# Save at dest40054c: pop    %rbx		# Restore %rbx40054d: retq			# Return0000000000400550 <mult2>:400550:  mov    %rdi,%rax	# a 400553:  imul   %rsi,%rax	# a * b400557:  retq			# Return
程序控制流程
  • 使用栈来支持程序的调用和返回。
  • 程序调用:调用标签
    • push推送数据,返回栈地址
    • 跳到函数调用标签
  • 返回地址
    • 调用函数之后,下一个指令的地址
  • 程序返回:ret
    • pop弹出地址,从栈中
    • 跳到地址

如图:
在这里插入图片描述

调用call:此时栈指针(%rsp)指向0x120, 指令指针(%rip)指向call指令。
在这里插入图片描述

运行mult2: 栈指针(%rsp)-8,指向0x118。指令指针(%rip)指向mult2中的程序。
在这里插入图片描述

mult2返回:指令指针(%rip)指向mult2中的ret。
在这里插入图片描述

调用函数之后,程序恢复执行:栈指针(%rsp)+8,指向0x120。指令指针(%rip)指向multstore中的程序。

拓展:
0x120 - 8 = 288 - 8 = 280 = 0x118

%rip

%rip: register instruction pointer, 指令指针寄存器。
它存储了当前正在执行的指令的内存地址。

当处理器执行程序时,它会按顺序读取内存中的指令并执行它们。%rip 寄存器指示了下一条要执行的指令的内存地址。当处理器执行完一条指令后,它会自动更新 %rip 寄存器,使其指向下一条要执行的指令的地址。

%rip 寄存器在程序执行期间是自动更新的,程序员无法直接修改它的值。

传递数据

前面六个参数存储在寄存器中:

  • %rdi
  • %rsi
  • %rdx
  • %rcx
  • %r8
  • %9
    当超过6个参数, 超过的参数存储到栈中:
...
Arg n
...
Arg 8
Arg 7

返回值:
%rax

ABI 标准

基本上代码能运行基于这样的假设:无论什么参数都按列出的顺序被传递给这一系列寄存器。
并且代码显然是依赖于这些假设。类似的,返回值的处理方式也是传递给指定的寄存器%rax。

示例

以上面的例子为例:

# x in %rdi,  y in %rsi, dest in %rdx
# t in %rax
void multstore(long x,long y,long *dest)
{long t = mult2(x, y);*dest = t;
}

管理局部数据

基于堆栈的语言

  • 支持递归
  • 代码课重入
    单个程序可以多个实例同时实例化
  • 需要一个地方来存储实例状态
    • 参数
    • 局部变量
    • 返回指针
  • 堆栈的原则
    • 特定的程序在有限时间内的状态
      从被调用到返回
    • 被调用方在调用方之前返回。
  • 按帧分配的堆栈
    单个程序实例化的状态。

调用和返回的功能之一是你可以对函数进行嵌套调用。
执行特定程序时,它只需要引用该函数内部的数据或已传递给它的值。
我们可以再这个栈上分配这个当前函数需要任意多的空间,我们不需要保留与该函数相关的任何信息,返回时,之前被调用的函数就可以永远消失了。这就是为什么我们要用栈的思想。
在栈上分配空间,它们返回的时候退出栈,并释放空间。这些栈的规则完全适用,它与过程调用和返回思想完美匹配。
因此,我们把栈上用于特定call(特定函数)的每个内存块称为栈帧。

栈帧

  • 内容
    • 返回信息
    • 局部存储
    • 临时存储
  • 管理
    • 当进入程序分配空间
      • 开始代码
      • call调用指令,推送数据(参数)
    • 返回时释放空间
      • 完成代码
      • ret指令,弹出数据(返回数据)

在这里插入图片描述

通常一个栈帧由两个指针分隔:栈指针, 基指针。
基指针式一个可选的指针,所以这个寄存器实际上并不会在你的过程中以帧指针的形式出现,所以通常情况西啊,你知道栈帧的唯一事情栈指针。因此,你甚至无法弄清楚栈帧的确切范围。你只知道栈的顶部式对应于最顶层函数的顶部栈帧。

每次开始调用一个函数时,栈上就会为它的栈帧分配一些空间。然后该栈帧的位置由一个指针或两个指针指示。

栈指针寄存器 %rsp : register stack pointer. 用于指向当前栈顶的位置。
栈是一种用于存储临时数据和函数调用信息的数据结构。通过修改 %rsp 的值,可以在栈上分配和释放内存空间。

基址指针寄存器 %rbp :用于指向当前函数的基址。基址指针通常用于访问函数的局部变量和参数。通过 %rbp,可以在栈帧中定位和访问这些变量和参数。

函数递归调用示例

在这里插入图片描述

每层调用都会由自己管理局部状态,这样栈的原则再次保证了它能正确的工作。

linux 栈帧

在这里插入图片描述

  • 当前栈帧(从顶部到底部)
    • 参数
    • 局部变量
    • 保存的寄存器上下文
    • 旧的栈帧指针(可选)
  • 调用者栈帧
    • 返回地址
      call指令推送数据。
    • 调用该函数的参数
示例
  • c 代码
long incr(long *p, long val)
{long x = *p;long y = x + val;*p = y;return x;
}long call_incr()
{long v1 = 15213;long v2 = incr(&v1, 3000);return v1 + v2;
}
  • 汇编代码
incr:movq	(%rdi), %raxaddq	%rax, %rsimovq	%rsi, (%rdi)ret
call_incr:subq	$16, %rspmovq	$15213, 8(%rsp)movl	$3000, %esileaq	8(%rsp), %rdicall	incraddq	8(%rsp), %raxaddq	$16, %rspret

movl $3000, %esi: 因为3000足够小,所以适用movl指令就行了。%esi寄存器,高32位会设置为0。编译器喜欢这么干的原因是movl比movq少一个字节。

寄存器保存数据惯例

  • 当程序yoo 调用 who
    • yoo 是调用者(caller)
    • who 是被调用者(callee)
  • 调用者保存
    调用者在调用前保存临时值到它自己的栈帧
  • 被调用者保存
    被调用者在使用前保存临时变量的值到它自己的栈帧。
    被调用者在返回给调用者时再次存储。

linux寄存器的使用

在这里插入图片描述

  • %rax
    返回值
    调用者保存
    可以被程序修改。

  • %rdi,…,%r9
    参数
    调用者保存
    可以被程序修改

  • %r1o,%r11
    调用者保存
    可以被程序修改。

这些寄存器也经常被作为临时寄存器。
在这里插入图片描述

  • %rbx,%r12,%r13,%r14
    被调用者保存
    被调用者必须保存和恢复

  • %rbp
    被调用者保存
    被调用者必须保存和恢复
    可能被用作栈帧指针
    可以混搭

  • %rsp
    特殊形式被调用者保存
    退出程序后恢复为原始值

递归说明

  • c 代码
long pcount_r(unsigned long x)
{if (x == 0)return 0;elsereturn (x & 1) + pcount_r(x >> 1);
}
  • 汇编代码
pcount_r:testq	%rdi, %rdijne	.L8movl	$0, %eaxret
.L8:pushq	%rbxmovq	%rdi, %rbxandl	$1, %ebxshrq	%rdicall	pcount_raddq	%rbx, %raxpopq	%rbxret

每个程序都会以这种方式处理%rbx, 即修改之前将它先暂存在栈上。

对于递归的观察

  • 栈帧意味着每个方法调用有着自己的私有存储空间
    存储寄存器和局部变量
    存储返回指针
  • 寄存器保存数据惯例可以放置一个函数调用破坏其他数据。
    除非C代码显式地这样做(例如,第9讲中的缓冲区溢出)
  • 栈满足调用返回匹配成对
    如果P调用Q,则Q在P之前返回。
    后进先出。

《深入理解计算机系统》书籍学习笔记

《深入理解计算机系统》学习笔记 - 第一课 - 课程简介
《深入理解计算机系统》学习笔记 - 第二课 - 位,字节和整型
《深入理解计算机系统》学习笔记 - 第三课 - 位,字节和整型
《深入理解计算机系统》学习笔记 - 第四课 - 浮点数
《深入理解计算机系统》学习笔记 - 第五课 - 机器级别的程序
《深入理解计算机系统》学习笔记 - 第六课 - 机器级别的程序二
《深入理解计算机系统》学习笔记 - 第七课 - 机器级别的程序三

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/293149.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[C++]模板进阶

目录 C模板进阶&#xff1a;&#xff1a; 非类型模板参数 模板的特化 函数模板特化 类模板特化 全特化 偏特化 模板的分离编译 模板总结 C模板进阶&#xff1a;&#xff1a; 非类型模板参数 模板参数可分为类型形参和非类型形参。 类型形参&#xff1a;出现在参数列表中&am…

[Linux] MySQL数据表(数据结构)管理

一、数据库 1.1 数据库的基本概念 数据库&#xff08;database&#xff09;是用来组织、存储和管理数据的仓库 数据库管理系统&#xff08;DBMS&#xff09;&#xff1a;是实现对数据有效组织&#xff0c;管理和存取的系统软件。 数据的建立和维护功能&#xff0c;数据定义…

Python 爬虫之下载视频(三)

批量下载某B主视频 文章目录 批量下载某B主视频前言一、基本思路二、确定遍历循环结构三、基本思路中第12步三、基本思路中第345步总结 前言 上一篇讲了如何去获取标题和视频链接。这篇就跟大家讲一下如何去下载这些视频。本篇会以标题和 视频链接 为突破口&#xff0c;来寻找…

前端传输formDate格式的数据,后端不能用@RequestBody接收

写了个接口&#xff0c;跟前端对接&#xff0c;前端说怎么一直415的报错 我寻思不对啊&#xff0c;我swagger都请求成功了&#xff0c;后来发现前端一直是以formdata格式提交的数据&#xff0c;这样我其实是可以不加RequestBody的&#xff1b; 知识点&#xff1a; RequestBody…

工会排队模式:一种创新的消费体验

随着互联网的普及和电子商务的快速发展&#xff0c;消费者对于购物体验的要求也越来越高。为了满足消费者的需求&#xff0c;许多电商平台和商家都在不断探索新的营销模式。其中&#xff0c;工会排队模式就是一种备受关注的新型消费体验模式。 一、工会排队模式的定义 工会排队…

力扣思维题——寻找重复数

题目链接&#xff1a;https://leetcode.cn/problems/find-the-duplicate-number/description/?envTypestudy-plan-v2&envIdtop-100-liked 这题的思维难度较大。一种是利用双指针法进行计算环的起点&#xff0c;这种方法在面试里很难说清楚&#xff0c;也很难想到。大致做…

大数据----33.hbase中的shell文件操作

HBase的命令行工具&#xff0c;最简单的接口&#xff0c;适合HBase管理使用&#xff0c;可以使用shell命令来查询HBase中数据的详细情况。 注意&#xff1a;如果进入hbase后长时间不操作&#xff1b; 发生hbase自动关闭没有了进程&#xff1b; 原因是内存不够&#xff1b;可以关…

STM32的以太网外设+PHY(LAN8720)使用详解(3):PHY寄存器详解

0 工具准备 1.野火 stm32f407霸天虎开发板 2.LAN8720数据手册 3.STM32F4xx中文参考手册1 PHY寄存器 前面介绍到&#xff0c;站管理接口&#xff08;SMI&#xff09;允许应用程序通过2线时钟和数据线访问任意PHY寄存器&#xff0c;同时该接口支持访问最多32个PHY&#xff0c;也…

如果要开发一个小程序一般需要多长时间呢?需要找哪些专业技术人员呢?

如果要开发一个小程序&#xff0c;一般需要多长时间呢&#xff1f; ‍小程序开发的时间通常取决于具体项目的复杂程度和开发人员的经验水平。 以虎克为例&#xff0c;一个简单的小程序&#xff0c;开发周期可能在1个月左右&#xff0c;而复杂度较高的小程序可能需要3个月或更长…

Sui 生态排名第一的头部流动性协议 NAVI Protocol 活动进行中

作为在熊市中启动的新生公链&#xff0c;Sui 正在稳步崛起。公链的 TVL 持续攀升&#xff0c;目前已经达到了 1.76亿美元&#xff0c;闯入了公链排名前20榜单。仅过去四个月内&#xff0c;TVL 增加了10倍&#xff0c;并且增长仍在继续&#xff0c;SUI 的价格在近期也有了很亮眼…

[湖湘杯 2021 final]Penetratable

第一次做到这种题 同样登录框 注册root的时候提示说root已经被注册过了 扫一下看看 访问看看好像也没有什么新的发现 回到登录框&#xff0c;登录抓包 username是base64编码&#xff0c;password也是md5加密的&#xff0c;say也是被base64编码过 经过尝试&#xff0c;注册ad…

深入解析Python装饰器及*args, **kwargs的妙用

深入解析Python装饰器及*args, **kwargs的妙用 简介&#xff1a; ​ 装饰器&#xff08;Decorator&#xff09;是 Python 中一种强大的语法特性&#xff0c;它允许在不修改原始函数代码的情况下&#xff0c;动态地扩展函数的功能。装饰器是函数或类&#xff0c;用于包装其他函…