从头开发一个RISC-V的操作系统(五)汇编语言编程

文章目录

  • 前提
  • RISC-V汇编语言入门
  • RISC-V汇编指令总览
    • 汇编指令操作对象
    • 汇编指令编码格式
    • add指令介绍
    • 无符号数
  • 练习
  • 参考链接

目标:通过这一个系列课程的学习,开发出一个简易的在RISC-V指令集架构上运行的操作系统。

前提

这个系列的大部分文章和知识来自于:[完结] 循序渐进,学习开发一个RISC-V上的操作系统 - 汪辰 - 2021春,以及相关的github地址。

在这个过程中,这个系列相当于是我的学习笔记,做个记录。

RISC-V汇编语言入门

能手写汇编代码的,在我的心目中,都是巨佬。只有明白底层硬件的人,才有可能去写汇编。

一个完整的RISC-V汇编程序有多条语句(statement)组成。一个典型的RISC-V汇编语句由3部分组成:
[label:] [operation] [comment]

  • label:任何以冒号结尾的标识符都被认为是一个标号。
  • operation可以有多种类型
    • instruction:直接对应二进制机器指令的字符串
    • pseudo-instruction:为了提高编写代码的效率,可以用一条伪指令指示汇编器产生多条实际的指令
    • directive:通过类似指令的形式(以.开头),通知汇编器如何控制代码的产生,不对应具体的指令
    • macro:采用.macro/.endm自定义的宏
  • comment:注释,以#开始到当前行结束

RISC-V汇编指令总览

汇编指令操作对象

寄存器:在这个系列中,我们只有32个通用寄存器,x0~x31,这个在之前我们已经展示过了。在RISC-V中,Hart在执行算数逻辑运算时所操作的数据必须直接来自寄存器。

内存:Hart可以执行在寄存器和内存之间的数据读写操作;读写操作使用字节位基本单位进行寻址;RV32最多可以访问 2 32 2^{32} 232个字节的内存空间。

汇编指令编码格式

在这里插入图片描述
RV32由6种指令编码格式。每一条指令有32bits,funct7/funct3和opcode一起决定最终的指令类型。指令在内存中按照小端序排列。rs2,rs1,rd都是指的是寄存器(register),imm指的是立即数。
大端序:高字节存放在内存的低地址;小端序:低字节存放在内存的低地址。
下面这张表指出了opcode是如何与指令对应的。
在这里插入图片描述
opcode总共7bits,第0和第1位都是11,第2到第四位和第5到第6位不同,则代表着指令类型不同,使用addsub指令举例。
在这里插入图片描述
先看opcode0110011在表中对应着OP,add和sub都应该属于OP,然后funct3也相同,但是funct7不同,代表着它们一个是add,一个是sub。

这里介绍的只是一个概貌,更多信息还要自己学习。

add指令介绍

在这里插入图片描述
通过上面的图片就可以明白一条汇编指令是如何到二进制代码的。同时这一块视频中也有详细地讲解。

无符号数

我们知道有符号数在计算机中都是使用二进制补码的形式保存的,最高位为符号位,0代表正数,1代表负数。正数的补码不变,负数的补码=反码+1。

练习

这里我们带大家做一个add2的练习。
汇编源码为:

# Add
# Format:
#	ADD RD, RS1, RS2
# Description:
#	The contents of RS1 is added to the contents of RS2 and the result is 
#	placed in RD..text			# Define beginning of text section.global	_start		# Define entry _start_start:li x6, 1		# x6 = 1li x7, -2		# x7 = -2add x5, x6, x7		# x5 = x6 + x7stop:j stop			# Infinite loop to stop execution.end			# End of file

make 以后,我们使用make code查看这个程序的二进制代码,然后逐行进行分析,如下:


test.elf:     file format elf32-littleriscvDisassembly of section .text:80000000 <_start>:.text			# Define beginning of text section.global	_start		# Define entry _start_start:li x6, 1		# x6 = 1
80000000:	00100313          	li	t1,1li x7, -2		# x7 = -2
80000004:	ffe00393          	li	t2,-2add x5, x6, x7		# x5 = x6 + x7
80000008:	007302b3          	add	t0,t1,t28000000c <stop>:stop:j stop			# Infinite loop to stop execution
8000000c:	0000006f          	j	8000000c <stop>

其他都没什么好说的,主要就是这个li指令以及add这个指令。add x5,x6,x7这个我们在上面展示过了,这里主要解释下li这个伪指令。
在这里插入图片描述
这里我们先从其他博客那里拿过来一个结论,
在这里插入图片描述

li伪指令把一个立即数imm加载到rd寄存器中。当imm在 [ − 2 11 , 2 11 − 1 ] [-2^{11} , 2^{11-1}] [211,2111]范围内(也就是[-2048~2047))的时候,li被转化成下面这条实际指令:

addi rd, x0,imm #rd=imm+0
x0是一个特殊的寄存器,值为0且永远不会改变

所以add x7, x0, -2 对应的二进制为:111111111110 00000 000 00111 0010011,前面的111111111110代表了-2,它是以二进制补码存储的;00000代表了寄存器x0,000是funct,00111代表了寄存器x7,最后的0010011则是opcode。和我们输出的hex一样。

那么当立即数imm不在这个范围,但在32位有符号数的范围内(也就是[-2147482648~-2048)以及(+2047~+2147482647])的时候,一条addi指令显然是不够了。 这时候就需要lui指令。

假设我们有这样的一条语句add x7, -3000,那么它对应的二进制是多少呢?先看它的二进制,如下图:
在这里插入图片描述
在立即数为-3000的情况下,一条li伪指令被分为了两条汇编指令luiaddiaddi我们已经在上面介绍过了,下面给出lui指令的说明。
在这里插入图片描述
看这个似乎有点懵,我们直接说怎么将-3000写入到x7寄存器的。
-3000的32位二进制反码为1111 1111 1111 1111 1111 0100 0100 1000,先取第12到第31位(通过右移12位就可以得到第12到第31位),也就是1111 1111 1111 1111 1111共20位,构成lui这条指令1111 1111 1111 1111 1111 00111 0110111 = fffff3b7。对应的操作就是:将20位左移12位,并将低12位置0,写入到x7中。
再取-3000的第0到第11位0100 0100 1000加到x7寄存器中(x7 = x7 + imm[0:11]),对应的二进制指令就是0100 0100 1000 00111 000 00111 0010011 = 44838393,可以看到,和程序的结果一样。这样大家阶对li伪指令有了进一步的了解。

参考链接

  1. https://zhuanlan.zhihu.com/p/367085156

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/594031.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++】模拟实现红黑树(插入)

目录 红黑树的概念 红黑树的性质 红黑树的调整情况 红黑树的模拟实现 枚举类型的定义 红黑树节点的定义 插入函数的实现 旋转函数的实现 左旋 右旋 自检函数的实现 红黑树类 红黑树的概念 红黑树&#xff0c;是一种二叉搜索树&#xff0c;但在每个结点上增加一个存储…

【剑指offr--C/C++】JZ7 重建二叉树

一、题目 二、思路及代码 前序遍历&#xff1a;中、左、右。所以前序遍历的第一个节点是树的根节点&#xff0c;第二个节点是左子树的根节点。。。。 中序遍历&#xff1a;左、中、右。树的根节点在中间某处 我们可以根据二者的特点结合一下&#xff1a;对于前序遍历序列{1,2,4…

查看MySQL版本的方式

文章目录 一、使用cmd输入命令行查看二、在mysql客户端服务器里查询 一、使用cmd输入命令行查看 1、打开 cmd &#xff0c;输入命令行&#xff1a; mysql --version 2、还是打开cmd&#xff0c;输入命令行&#xff1a;mysql -V (注意了&#xff0c;此时的V是个大写的V) 二、…

海外问卷调查项目拆解(操作全流程演示)保姆级攻略具体操作

海外问卷调查是怎么做的&#xff1f;好做吗&#xff1f; 关于这个问题&#xff0c;不管我说好做、或者不好做&#xff0c;都并不能解决问题&#xff1b; 所以&#xff0c;这篇文章直接把做题的全过程展现给你看&#xff0c;你自己去真实地感受一下&#xff0c;这个玩意儿到底…

华媒舍:3个科学指导,协助油管大V写下爆款文章

油管&#xff08;YouTube&#xff09;作为一个重要的视频分享平台&#xff0c;吸引了很多的观众和原创者。作为一位油管大V&#xff0c;你可能会一直在努力提升自己的文章质量以吸引更多的观众和订阅者。下面我们就为您提供三个科学指导&#xff0c;帮助自己写下更具有爆品发展…

浅析JavaWeb内存马基础原理与查杀思路

文章目录 前言Java内存马内存马分类&原理JavaWeb三大组件注入Servlet内存马注入Filter型内存马JAVA Agent内存马 哥斯拉木马0x01 WebShell0x02 MemShell0x03 FilterShell0x04 Arthas排查0x05 scanner查杀 总结 前言 几年前写过《Web安全-一句话木马》&#xff0c;主要介绍…

stargan项目实战及源码解读

数据及代码链接见文末 ​​​​​​​论文解析&#xff1a;Star GAN论文解析-CSDN博客 1.测试模块效果与实验分析 测试数据需要准备两个文件夹src&#xff08;源&#xff09;和ref&#xff08;目标&#xff09;&#xff0c;这两个文件夹下的文件夹名称代表各个domain。 运行测…

[lesson07]函数参数的扩展

函数参数的扩展 函数参数的默认值 C中可以在函数声明时为参数提供一个默认值 当函数调用时没有提供参数的值&#xff0c;则使用默认值 参数的默认值必须在函数声明中指定 函数默认参数的规则 参数的默认值必须从右向左提供函数调用时使用了默认值&#xff0c;则后续参数必…

数据结构:详解【树和二叉树】

1. 树的概念及结构&#xff08;了解&#xff09; 1.1 树的概念 树是一种非线性的数据结构&#xff0c;它是由n&#xff08;n>0&#xff09;个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树&#xff0c;也就是说它是根朝上&#xff0c;而叶朝…

小林coding图解计算机网络|基础篇02|键入网址到网页显示,期间发生了什么?

小林coding网站通道&#xff1a;入口 本篇文章摘抄应付面试的重点内容&#xff0c;详细内容还请移步&#xff1a;小林coding网站通道 文章目录 孤单小弟——HTTP真实地址查询——DNS指南好帮手——协议栈可靠传输——TCP远程定位——IP两点传输——MAC出口——网卡送别者——交…

一文搞懂 ThreadLocal

简介 ThreadLocal存取的数据&#xff0c;总是与当前线程相关&#xff0c;也就是说&#xff0c;JVM 为每个运行的线程&#xff0c;绑定了私有的本地实例存取空间&#xff0c;从而为多线程环境常出现的并发访问问题提供了一种隔离机制。 ThreadLocal的作用是提供线程内的局部变…

突破编程_前端_ACE编辑器(选中区域、跳转行以及点击事件)

1 选中区域 要在 ACE 编辑器中选中一个区域&#xff0c;通常需要使用编辑器的 selection 对象。 以下是一个简单的示例&#xff0c;展示了如何使用 ACE 编辑器的 API 来选中一个特定的区域&#xff1a; 初始化 ACE 编辑器&#xff1a;首先&#xff0c;需要在页面上初始化 AC…