Go plan9 汇编:说透函数栈

news/2024/11/15 18:01:25/文章来源:https://www.cnblogs.com/xingzheanan/p/18392005

原创文章,欢迎转载,转载请注明出处,谢谢。


0. 前言

函数是 Go 的一级公民,本文从汇编角度出发看看我们常用的一些函数在干什么。

1. 函数

1.1 main 函数

在 main 函数中计算两数之和如下:

package mainfunc main() {x, y := 1, 2z := x + yprint(z)
}

使用 dlv 调试函数(不了解 dlv 的请看 Go plan9 汇编: 打通应用到底层的任督二脉):

# dlv debug
Type 'help' for list of commands.
(dlv) b main.main
Breakpoint 1 set at 0x45feca for main.main() ./ex4.go:3
(dlv) c
> main.main() ./ex4.go:3 (hits goroutine(1):1 total:1) (PC: 0x45feca)1: package main2:
=>   3: func main() {4:         x, y := 1, 25:         z := x + y6:         print(z)7: }

disass 查看对应的汇编指令:

(dlv) 
TEXT main.main(SB) /root/go/src/foundation/ex4/ex4.goex4.go:3        0x45fec0        493b6610                cmp rsp, qword ptr [r14+0x10]ex4.go:3        0x45fec4        763d                    jbe 0x45ff03ex4.go:3        0x45fec6        55                      push rbpex4.go:3        0x45fec7        4889e5                  mov rbp, rsp
=>      ex4.go:3        0x45feca*       4883ec20                sub rsp, 0x20ex4.go:4        0x45fece        48c744241801000000      mov qword ptr [rsp+0x18], 0x1ex4.go:4        0x45fed7        48c744241002000000      mov qword ptr [rsp+0x10], 0x2ex4.go:5        0x45fee0        48c744240803000000      mov qword ptr [rsp+0x8], 0x3ex4.go:6        0x45fee9        e8d249fdff              call $runtime.printlockex4.go:6        0x45feee        488b442408              mov rax, qword ptr [rsp+0x8]ex4.go:6        0x45fef3        e86850fdff              call $runtime.printintex4.go:6        0x45fef8        e8234afdff              call $runtime.printunlockex4.go:7        0x45fefd        4883c420                add rsp, 0x20ex4.go:7        0x45ff01        5d                      pop rbpex4.go:7        0x45ff02        c3                      retex4.go:3        0x45ff03        e8d8cdffff              call $runtime.morestack_noctxtex4.go:3        0x45ff08        ebb6                    jmp $main.main
(dlv) regsRsp = 0x000000c00003e758

相信看过 Go plan9 汇编: 打通应用到底层的任督二脉 的同学对上述汇编指令已经有一定了解的。

这里进入 main 函数,执行到 sub rsp, 0x20 指令,该指令为 main 函数开辟 0x20 字节的内存空间。继续往下执行,分别将 0x10x20x3 放到 [rsp+0x18][rsp+0x10][rsp+0x8] 处(从汇编指令好像没看到 z := x + y 的加法,合理怀疑是编译器做了优化)。

继续,mov rax, qword ptr [rsp+0x8][rsp+0x8] 地址的值 0x3 放到 rax 寄存器中。然后,调用 call $runtime.printint 打印 rax 的值。实现输出两数之后。后续的指令我们就跳过了,不在赘述。

1.2 函数调用

在 main 函数中实现两数之和,我们没办法看到函数调用的过程。
接下来,定义 sum 函数实现两数之和,在 main 函数中调用 sum。重点看函数在调用时做了什么。

示例如下:

package mainfunc main() {a, b := 1, 2println(sum(a, b))
}func sum(x, y int) int {z := x + yreturn z
}

使用 dlv 调试函数:

# dlv debug
Type 'help' for list of commands.
(dlv) b main.main
Breakpoint 1 set at 0x45feca for main.main() ./ex6.go:3
(dlv) c
> main.main() ./ex6.go:3 (hits goroutine(1):1 total:1) (PC: 0x45feca)1: package main2:
=>   3: func main() {4:         a, b := 1, 25:         println(sum(a, b))6: }7:8: func sum(x, y int) int {
(dlv) disass
Sending output to pager...
TEXT main.main(SB) /root/go/src/foundation/ex6/ex6.goex6.go:3        0x45fec0        493b6610                cmp rsp, qword ptr [r14+0x10]ex6.go:3        0x45fec4        764f                    jbe 0x45ff15ex6.go:3        0x45fec6        55                      push rbpex6.go:3        0x45fec7        4889e5                  mov rbp, rsp
=>      ex6.go:3        0x45feca*       4883ec28                sub rsp, 0x28ex6.go:4        0x45fece        48c744241801000000      mov qword ptr [rsp+0x18], 0x1ex6.go:4        0x45fed7        48c744241002000000      mov qword ptr [rsp+0x10], 0x2ex6.go:5        0x45fee0        b801000000              mov eax, 0x1ex6.go:5        0x45fee5        bb02000000              mov ebx, 0x2ex6.go:5        0x45feea        e831000000              call $main.sumex6.go:5        0x45feef        4889442420              mov qword ptr [rsp+0x20], raxex6.go:5        0x45fef4        e8c749fdff              call $runtime.printlockex6.go:5        0x45fef9        488b442420              mov rax, qword ptr [rsp+0x20]

regs 查看寄存器状态:

(dlv) regsRip = 0x000000000045fecaRsp = 0x000000c00003e758Rbp = 0x000000c00003e758...

继续往下分析指令的执行过程:

  1. sub rsp, 0x28: rsp 的内存地址减 0x28,意味着 main 函数开辟 0x28 字节的栈空间。
  2. mov qword ptr [rsp+0x18], 0x1mov qword ptr [rsp+0x10], 0x2:将 0x10x2 分别放到内存地址 [rsp+0x18][rsp+0x10] 中。
  3. mov eax, 0x1mov ebx, 0x2:将 0x10x2 分别放到寄存器 eaxebx 中。

跳转到 0x45feea 指令:

(dlv) b *0x45feea
Breakpoint 2 set at 0x45feea for main.main() ./ex6.go:5
(dlv) c
> main.main() ./ex6.go:5 (hits goroutine(1):1 total:1) (PC: 0x45feea)1: package main2:3: func main() {4:         a, b := 1, 2
=>   5:         println(sum(a, b))6: }7:8: func sum(x, y int) int {9:         z := x + y10:         return z
(dlv) disass
Sending output to pager...
TEXT main.main(SB) /root/go/src/foundation/ex6/ex6.goex6.go:3        0x45fec0        493b6610                cmp rsp, qword ptr [r14+0x10]ex6.go:3        0x45fec4        764f                    jbe 0x45ff15ex6.go:3        0x45fec6        55                      push rbpex6.go:3        0x45fec7        4889e5                  mov rbp, rspex6.go:3        0x45feca*       4883ec28                sub rsp, 0x28ex6.go:4        0x45fece        48c744241801000000      mov qword ptr [rsp+0x18], 0x1ex6.go:4        0x45fed7        48c744241002000000      mov qword ptr [rsp+0x10], 0x2ex6.go:5        0x45fee0        b801000000              mov eax, 0x1ex6.go:5        0x45fee5        bb02000000              mov ebx, 0x2
=>      ex6.go:5        0x45feea*       e831000000              call $main.sumex6.go:5        0x45feef        4889442420              mov qword ptr [rsp+0x20], raxex6.go:5        0x45fef4        e8c749fdff              call $runtime.printlockex6.go:5        0x45fef9        488b442420              mov rax, qword ptr [rsp+0x20]ex6.go:5        0x45fefe        6690                    data16 nop

在执行 call $main.sum 前,让我们先看下内存分布:

image

(绿色部分表示 main 函数栈)

继续执行 call $main.sum:

(dlv) si
> main.sum() ./ex6.go:8 (PC: 0x45ff20)
TEXT main.sum(SB) /root/go/src/foundation/ex6/ex6.go
=>      ex6.go:8        0x45ff20        55                      push rbpex6.go:8        0x45ff21        4889e5                  mov rbp, rspex6.go:8        0x45ff24        4883ec10                sub rsp, 0x10ex6.go:8        0x45ff28        4889442420              mov qword ptr [rsp+0x20], raxex6.go:8        0x45ff2d        48895c2428              mov qword ptr [rsp+0x28], rbxex6.go:8        0x45ff32        48c7042400000000        mov qword ptr [rsp], 0x0ex6.go:9        0x45ff3a        4801d8                  add rax, rbxex6.go:9        0x45ff3d        4889442408              mov qword ptr [rsp+0x8], raxex6.go:10       0x45ff42        48890424                mov qword ptr [rsp], raxex6.go:10       0x45ff46*       4883c410                add rsp, 0x10ex6.go:10       0x45ff4a        5d                      pop rbpex6.go:10       0x45ff4b        c3                      ret
(dlv) regsRip = 0x000000000045ff20Rsp = 0x000000c00003e728Rbp = 0x000000c00003e758

可以看到,Rsp 寄存器往下减 8 个字节,压栈开辟 8 个字节空间。继续往下分析指令:

  1. push rbp:将 rbp 寄存器的值压栈,rbp 中存储的是地址 0x000000c00003e758。由于进行了压栈操作,这里的 Rsp 会往下减 8 个字节。
  2. mov rbp, rsp:将当前 rsp 的值给 rbprbpsum 函数栈的栈底。
  3. sub rsp, 0x10rsp 往下减 0X10 个字节,开辟16 个字节的空间,做为 sum 的函数栈,此时 rsp 的地址为 0x000000c00003e710,表示函数栈的栈顶。

执行到这里,我们画出内存分布图如下:

image

继续往下分析:

  1. mov qword ptr [rsp+0x20], raxmov qword ptr [rsp+0x28], rbx:分别将 rax 寄存器的值 1 放到 [rsp+0x20]:0x000000c00003e730rbx 寄存器的值 2 放到 [rsp+0x28]:0x000000c00003e738
  2. mov qword ptr [rsp], 0x0:将 0 放到 [rsp] 中。
  3. add rax, rbx:将 rax 和 rbx 的值相加,结果放到 rax 中,相加后 rax 中的值为 3。
  4. mov qword ptr [rsp+0x8], rax:将 3 放到 [rsp+0x8] 中。
  5. mov qword ptr [rsp], rax:将 3 放到 [rsp] 中。

根据上述分析,画出内存分布图如下:

image

可以看出,传给 sum 的形参 x 和 y 实际是在 main 函数栈分配的。

继续往下执行:

  1. add rsp, 0x10rsp 寄存器加 0x10 回收 sum 栈空间。
  2. pop rbp:将存储在 0x000000c00003e720 的值 0x000000c00003e758 移到 rbp 中。
  3. retsum 函数返回。

在执行 ret 指令前最后看下寄存器的状态:

(dlv) regsRip = 0x000000000045ff4bRsp = 0x000000c00003e728Rbp = 0x000000c00003e758

我们知道 Rip 寄存器存储的是运行指令所在的内存地址,那么问题就来了,当函数返回时,要执行调用函数的下一条指令:

TEXT main.sum(SB) /root/go/src/foundation/ex6/ex6.goex6.go:5        0x45feea*       e831000000              call $main.sumex6.go:5        0x45feef        4889442420              mov qword ptr [rsp+0x20], rax

这里我们需要 main.sum 返回后执行的下一条指令是 mov qword ptr [rsp+0x20], rax。可是 Rip 指令怎么获得指令所在的地址 0x45feef 呢?

答案在 call $main.sum 这里,这条指令会将下一条指令压栈,在 sum 函数调用 ret 返回时,将之前压栈的指令移到 Rip 寄存器中。这个压栈的内存地址是 0x000000c00003e728,查看其中的内容:

(dlv) print *(*int)(uintptr(0x000000c00003e728))
4587247

4587247 的十六进制就是 0x45feef

执行 ret

(dlv) si
> main.main() ./ex6.go:5 (PC: 0x45feef)ex6.go:4        0x45fece        48c744241801000000      mov qword ptr [rsp+0x18], 0x1ex6.go:4        0x45fed7        48c744241002000000      mov qword ptr [rsp+0x10], 0x2ex6.go:5        0x45fee0        b801000000              mov eax, 0x1ex6.go:5        0x45fee5        bb02000000              mov ebx, 0x2ex6.go:5        0x45feea*       e831000000              call $main.sum
=>      ex6.go:5        0x45feef        4889442420              mov qword ptr [rsp+0x20], raxex6.go:5        0x45fef4        e8c749fdff              call $runtime.printlockex6.go:5        0x45fef9        488b442420              mov rax, qword ptr [rsp+0x20]ex6.go:5        0x45fefe        6690                    data16 nopex6.go:5        0x45ff00        e85b50fdff              call $runtime.printintex6.go:5        0x45ff05        e8f64bfdff              call $runtime.printnl
(dlv) regsRip = 0x000000000045feefRsp = 0x000000c00003e730Rbp = 0x000000c00003e758

可以看到 Rip 指向了下一条指令的位置。

继续往下执行:

  1. mov qword ptr [rsp+0x20], rax:将 3 放到 [rsp+0x20] 中,[rsp+0x20] 就是存放 sum 函数返回值的内存地址。
  2. call $runtime.printint:调用 runtime.printint 打印返回值 3。

分析完上述调用函数的过程我们可以画出函数栈调用的完整内存分布如下:

image

2. 小结

本文从汇编角度看函数调用的过程,力图做到对函数调用有个比较通透的了解。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/790774.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Rust China Conf 2024 震撼来袭,INFINI Pizza 搜索引擎重磅亮相!

随着 Rust 语言以其在性能、安全性和并发性方面的卓越表现,赢得了全球开发者的青睐,Rust 社区正迎来前所未有的发展机遇。在这个充满活力与潜力的背景下,Rust China Conf 2024 震撼来袭! Rust 大会介绍 Rust 大会即将于 9 月 7 日 - 8 日在上海盛大举办。作为年度国内规模最…

winshark 过滤包

包协议 Http,TCP,UDP,这几个, 游戏是tcp 加心跳包,和http多一些 点击capture filter 新增 ip host=47.96.185.162 之前一个个比对,查看服务器地址,如果游戏是杭州的, 那服务器机房在杭州 阿里巴巴,就没错。 https://site.ip138.com/47.96.185.162在mumu模拟器上,选择…

unity学习笔记(三)

综合练习小案例 玩家控制 基本流程设定移速(全局,以便在unity界面中直接修改)(如public float speed = 5;)将移动单独封装成方法在移动方法中完成获取输入、设置移动动画、设置移动时朝向以及移动角色private void Move(){//获取输入int inputX = (int)UnityEngine.Input.…

RabbitMQ 队列使用基础教程

实践环境 JDK 1.8.0_121 amqp-client 5.16.0 附:查看不同版本的amqp-client客户端支持的Java JDK版本 https://www.rabbitmq.com/client-libraries/java-versions mavn settings.xml <?xml version="1.0" encoding="UTF-8" ?> <settings xsi:…

2024 年 13 个适用于 Linux 的最佳照片图像编辑器

2024 年 13 个适用于 Linux 的最佳照片图像编辑器 在本文中,我回顾了各种 Linux 发行版上可用的一些最佳照片编辑软件。这些不是唯一可用的照片编辑器,但却是 Linux 用户最流行和最常用的照片编辑器之一。 1. GIMP 首先,在列表中,我们有 GIMP,一个免费、开源、跨平台、可扩…

设置IIS支持ashx

打开【处理程序映射】 默认界面如下(是不支持处理ashx的):如果需要设置能处理ashx,需要开启ASP.NET 4.8再打开【处理程序映射】,如下:

Openshift 3.11单机版 离线安装

Openshift 3.11单机版 离线安装 ‍ 前置条件虚拟机: 建议系统内存>=6G,CPU>=4。 镜像仓库:在虚拟机上能够访问到该镜像仓库,如果没有,推荐使用harbor自建。 docker:虚拟机上需要安装docker,这里使用的是18.09版本。离线安装可参考 docker 离线安装 或自行下载rpm包…

Openshift 3

Openshift 3.11单机版 离线安装 ‍ 前置条件虚拟机: 建议系统内存>=6G,CPU>=4。 镜像仓库:在虚拟机上能够访问到该镜像仓库,如果没有,推荐使用harbor自建。 docker:虚拟机上需要安装docker,这里使用的是18.09版本。离线安装可参考 docker 离线安装 或自行下载rpm包…

类图各个箭头和符号的含义

参考资料:看懂类图和时序图案例:车的类图结构为<<abstract>>,表示车是一个抽象类; 它有两个继承类:小汽车和自行车;它们之间的关系为实现关系,使用带空心箭头的虚线表示; 小汽车为与SUV之间也是继承关系,它们之间的关系为泛化关系,使用带空心箭头的实线表…

042.CI4框架CodeIgniter,控制器过滤器Filter配合Services的使用

01、Config中的Services.php代码如下:<?phpnamespace Config;use App\Libraries\Tx_Auth; use CodeIgniter\Config\BaseService;class Services extends BaseService {//用户权限类public static function user_auth($getShared = true){echo 测试service能不能正常调用。…

第一次作业:自我介绍+软件五问

这个作业属于哪个课程 https://edu.cnblogs.com/campus/gdgy/CSGrade22-34这个作业要求在哪里 https://edu.cnblogs.com/campus/gdgy/CSGrade22-34/homework/13228这个作业的目标 初步学会使用博客园自我介绍 大家好!我是计算机学院22级计科3班的学生迪力拜尔赛买提 爱好:跑步…

机器学习之——决策树条件熵计算[附加计算程序]

0 前言本文主要介绍决策树条件熵的计算并给出若干例子帮助理解。 读者需要具备信息熵计算知识,若不了解请看:信息熵1 条件熵2 数据集 游玩数据集,请看:数据集 1.1节 3 条件熵的计算 使用所给游玩数据集。计算H(play|outlook)的条件熵(在Y随机变量为outlook条件下,X随机变量…