解码新时代内存架构:探秘数据在内存中的灵动驻足

欢迎来到白刘的领域   Miracle_86.-CSDN博客

系列专栏  C语言知识

先赞后看,已成习惯

   创作不易,多多支持!

随着信息技术的飞速发展,我们身处一个数据爆炸的时代。数据的处理和存储方式正日益成为技术革新的重要领域。在新时代的内存架构中,数据的灵动驻足,正为计算世界注入无限活力。今天我们就来简单探讨一下数据在内存中的存储。

目录

一、整数在内存中的存储

二、大小端字节序和字节序判断

2.1 什么是大小端

2.2 为什么要有大小端

2.3 练习

练习1

 练习2

练习3

三、浮点数在内存中的存储

3.1 浮点数存的过程

3.2 浮点数取的过程

3.3 题目解析


一、整数在内存中的存储

前面在讲解操作符的时候,我们就提到了原码、反码、补码。这三个是整数的二进制的三种表示方法。

 武器大师——操作符详解(上)-CSDN博客

三种表示方法均有符号位数值位两部分,符号位都是由“ 0 ”表示“ 正 ”,“ 1 ”表示“ 负 ”,而数值位的最高一位被当做符号位,其余的都是数值位。

正整数的原、反、补码都相同。

负整数则各不相同,需要运算:

原码:直接将数值按照正负数的形式翻译成二进制得到的就是原码。

反码:原码的符号位不变,其它位都取反(也就是0变成1,1变成0)。

补码:就是在反码的基础上+1。

而对于整型来讲:数据在内存中存放的其实是补码。

为什么呢?

在计算机系统中,数值⼀律⽤补码来表⽰和存储。
原因在于,使⽤补码,可以将符号位和数值域统⼀处理;
同时,加法和减法也可以统⼀处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。 

二、大小端字节序和字节序判断

当我们了解完整数在内存中的存储后,我们调试看会发现一个细节:

#include <stdio.h>
int main()
{int a = 0x11223344;return 0;
}

调试的时候我们可以看到a中的0x11223344这个数字是以字节为单位,倒着存储的。那它为什么不是正着存储的呢?

2.1 什么是大小端

其实超过一个字节的数据在内存中存储的时候,不可避免出现存储顺序的问题,按照不同的存储顺序,我们分为大端字节序和小端字节序。

大端(存储)模式:是指数据的字节内容保存在地址处,而数据的字节内容保存到地址处。

小端(存储)模式:是指数据的字节内容保存在地址处,而数据的字节内容保存到地址处。

2.2 为什么要有大小端

在计算机系统中,内存的基本组织单位是字节,每个内存地址单元都对应一个字节,即8位。然而,在编程语言如C语言中,除了8位的char类型外,还存在其他位宽的数据类型,如16位的short型和32位的long型(具体位宽可能因编译器而异)。

当使用位数大于8位的处理器,比如16位或32位处理器时,由于它们的寄存器宽度超过一个字节,这就涉及到了如何将多个字节组合在一起存储的问题。这种多字节数据的存储顺序问题导致了两种不同的字节序模式:大端字节序和小端字节序。

以16位的short型变量x为例,假设其在内存中的起始地址为0x0010,并且x的值为0x1122。在这里,0x11是高位字节,0x22是低位字节。如果采用大端字节序,高位字节0x11会被存放在较低的地址0x0010中,而低位字节0x22则存放在较高的地址0x0011中。相反,如果采用小端字节序,存储顺序则正好相反。

在我们常见的X86架构中,采用的是小端字节序。然而,不同的处理器架构或编程环境可能有不同的选择。例如,KEIL C51通常使用大端字节序,而许多ARM和DSP处理器则采用小端字节序。甚至有些ARM处理器允许通过硬件配置来选择使用大端字节序还是小端字节序。

2.3 练习

练习1

设计一个程序来判断当前机器的字节序。(10分)——百度笔试题。

//代码1
#include <stdio.h>
int check_sys()
{int i = 1;return (*(char*)&i);
}
int main()
{int ret = check_sys();if (ret == 1){printf("⼩端\n");}else{printf("⼤端\n");}return 0;
}

思路:我们知道整型1的原码是0x00 00 00 01(仅写8位做示例),如果按照小端字节序,它存放的应该是01 00 00 00;如果是大端则是00 00 00 01。那我们只需要判断第一个字节是00还是01即可,所以我们用到了强制类型转换,将其转换成char*。

//代码2
int check_sys()
{union{int i;char c;}un;un.i = 1;return un.c;
}

 第二种方法则用到了联合体,这段先放着,我们以后再来讲(继续挖坑ing)。

 练习2
#include <stdio.h>
int main()
{char a = -1;signed char b = -1;unsigned char c = -1;printf("a=%d,b=%d,c=%d", a, b, c);return 0;
}

这里先说一下什么是signed char以及unsigned char,正常的char我们都知道,存放一个字节,也就是8个比特位,而signed char是有符号字符型,说明它的最高位被当成了符号位,而unsigned char就是无符号的,那接下来就可以计算了。

//对于a://首先写出-1的原码   10000000 00000000 00000000 00000001
//反码              11111111 11111111 11111111 11111110
//补码              11111111 11111111 11111111 11111111
//由于a为char 所以只能存储一个字节,所以存储的为11111111
//继续计算,补码变成原码,取反+1,              10000001
//所以输出-1。//对于b,和a同理//对于c,因为它是无符号的,所以存储的为10000001,直接换算为255

来看运行结果:

练习3
#include <stdio.h>
int main()
{char a = -128;printf("%u\n", a);return 0;
}

如果想知道这题如何做,我们首先要知道%u是什么,它的意思是认为a中存放的是无符号整数。由于a为char类型,所以我们首先要进行整型提升。

//原码 10000000 00000000 00000000 10000000
//反码 11111111 11111111 11111111 01111111
//补码 11111111 11111111 11111111 10000000//由于%u,所以打印出来一个很大的数

 运行结果:

三、浮点数在内存中的存储

常见的浮点数:3.14159、1E10...浮点数家族包括:float、double、long double类型。

浮点数的范围:在<float.h>中定义。

#include <stdio.h>
int main()
{int n = 9;float* pFloat = (float*)&n;printf("n的值为:%d\n", n);printf("*pFloat的值为:%f\n", *pFloat);*pFloat = 9.0;printf("num的值为:%d\n", n);printf("*pFloat的值为:%f\n", *pFloat);return 0;
}

来看运行结果:

上述代码的n和*pFloat明明存储的是一样的值为什么两次*pFloat的值不一样呢?

要理解这个结果的话,我们需要搞懂浮点数在计算机内部的存储方法。

3.1 浮点数存的过程

根据国际标准IEEE(电气和电子工程协会)754,任意一个二进制浮点数V可以表示成下面的形式:V=\left ( -1 \right )^{S}\ast M\ast 2^{E}(其中\left ( -1 \right )^{S}代表符号位,M代表有效数字,2^{E}代表指数位)。

举个例子:

十进制的5.0,写成二进制是101.0,相当于1.01*2²,S=0,M=1.01,E=2。

十进制的-5.0,写成二进制是-101.0,相当于-1.01*2²,S=1,M=1.01,E=2。

IEEE 754规定:

对于32位的浮点数,最高1位存储符号位S,之后的8位存储指数E,剩下的23位存储有效数字M;

对于64位的浮点数,最高1位存储符号位S,之后的11位存储指数E,剩下的23位存储有效数字M。

IEEE 754对M和E还有一些特殊规定。

前面说过,1≤M<2,也就是说M可以写成1.xxxxxxxxx,其中xxxxxxxxx是小数部分。

IEEE 754规定,在计算机内部保存M时,默认这个数的第一位是1,因此可以被舍去,只保存后面的小数部分。比如保存1.01时,只保存后面的01,等到读取的时候,再把前面的1加上,这样做的目的,是可以节省1位有效数字。以32位浮点数为例,留给M的只有23位,将1舍去后,就可以保留24位。

而至于指数E,情况就比较复杂了。

首先E是一个无符号整数(unsigned int)。

这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE 754规定,存⼊内存时E的真实值必须再加上⼀个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。⽐如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

3.2 浮点数取的过程

E从内存中取出还可以分为三种情况:

E不全为0或不全为1

这时,浮点数就采⽤下⾯的规则表⽰,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第⼀位的1。
⽐如:0.5 的⼆进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为1.0*2^(-1),其阶码为-1+127(中间值)=126,表⽰为01111110,⽽尾数1.0去掉整数部分为0,补⻬0到23位00000000000000000000000,则其⼆进制表⽰形式为:

0 01111110 00000000000000000000000

E全为0

这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第⼀位的1,⽽是还原为0.xxxxxx的小数。这样做是为了表⽰±0,以及接近于0的很小的数字。

0 00000000 00100000000000000000000

E全为1

这时,如果有效数字M全为0,表⽰±⽆穷⼤(正负取决于符号位s)。

0 11111111 00010000000000000000000

3.3 题目解析

之后我们再来回到题目

首先第一个问题,为什么9还原成浮点数,就变成了0.000000?

9以整型的形式存储在内存中,得到以下二进制序列:

0000 0000 0000 0000 0000 0000 0000 1001

我们按照刚刚我们讲的,将其拆分,得到,S=0,E=00000000,剩下的是M。

所以V=(-1)^0 × 0.00000000000000000001001×2^(-126)=1.001×2^(-146)

显然这是一个接近无穷小的一个数,保留即是0.000000。

再来看第二个问题,为什么浮点数9.0,整数打印是1091567616。

首先,9.0二进制为1001.0,即1.001*2³。

所以:9.0=(-1)º ×(1.001)×2³,

那么,第⼀位的符号位S=0,表示这是一个正数。有效数字M等于001后⾯再加20个0,凑满23位,即M的二进制10000010 

所以,写成⼆进制形式,应该是S+E+M,即

0 10000010 001 0000 0000 0000 0000 0000
这个32位的⼆进制数,被当做整数来解析的时候,就是整数在内存中的补码,原码正是
1091567616。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/564035.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI程序员革命:探析Devin的登场与编程未来

✨✨ 欢迎大家来访Srlua的博文&#xff08;づ&#xffe3;3&#xffe3;&#xff09;づ╭❤&#xff5e;✨✨ &#x1f31f;&#x1f31f; 欢迎各位亲爱的读者&#xff0c;感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua小谢&#xff0c;在这里我会分享我的知识和经验。&am…

BUG未解之谜01-指针引用之谜

在leetcode里面刷题出现的问题&#xff0c;当我在sortedArrayToBST里面给root赋予初始值NULL之后&#xff0c;问题得到解决&#xff01; 理论上root是未初始化的变量&#xff0c;然后我进入insert函数之后&#xff0c;root引用的内容也是未知值&#xff0c;因此无法给原来的二叉…

apifox创建接口含中文字符报错的两种解决方案

针对apifox的含中文报错解决方法&#xff1a; 方法一&#xff1a;创建相应接口后&#xff0c;在设置中URL自动编码为WHATING。 方法二&#xff1a;直接将浏览器的url复制到apifox中&#xff0c;浏览器会自动解析配置中文转换路径。

常见的OOM 问题的 6 种场景

今天跟大家一起聊聊线上服务出现 OOM 问题的 6 种场景,希望对你会有所帮助。 一、堆内存 OOM 堆内存 OOM 是最常见的 OOM 了。 出现堆内存 OOM 问题的异常信息如下: java.lang.OutOfMemoryError: Java heap space此 OOM 是由于 JVM 中 heap 的最大值,已经不能满足需求了…

一分钟学习Markdown语法

title: 一分钟学习Markdown语法 date: 2024/3/24 19:33:29 updated: 2024/3/24 19:33:29 tags: MD语法文本样式列表结构链接插入图片展示练习实践链接问题 欢迎来到Markdown语法的世界&#xff01;Markdown是一种简单而直观的标记语言&#xff0c;让文本排版变得轻松有趣。接下…

尝试Docker Dev Environments

无法从本地目录创建容器环境 创建的容器环境无法在VS Code打开 从官方仓库打开 结果vscode报错。fine&#xff0c;告辞。老老实实用本地环境开发。

IPV6协议之DHCPV6

目录 背景&#xff1a; 一、DHCPV6概述 DHCPv6 Client&#xff1a; DHCPv6 Relay&#xff1a; DHCPv6 Server&#xff1a; 二、DHCPV6工作原理 DHCPV6无状态自动分配 三、DHCP基础配置 服务端 四、DHCPV6地址更新时间&#xff08;DHCPV4租期&#xff09; 五、DHCPV6…

Ubuntu系统——操作PostgreSQL数据库

目录 一、安装PostgreSQL数据库 二、操作PostgreSQL数据库 1.设置PostgreSQL数据库用户密码 2.进入postgres用户 3.查看所有数据库——\l&#xff08;L的小写&#xff09; 4.创建数据库 5.删除数据库 6.查看版本号 7.授权远程登录 三、PostgresSQL数据库的数据类型 …

8年测试经验,自动化测试最容易犯的几个错误总结,一篇概全...

目录&#xff1a;导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09; 前言 1、自动化一切 我…

Personal Website

Personal Website Static Site Generators hexo hugo jekyll Documentation Site Generator gitbook vuepress vitepress docsify docute docusaurus Deployment 1. GitHub Pages 2. GitLab Pages 3. vercel 4. netlify Domain 域名注册 freessl 域名解析域名…

python类属性和global变量区别

数据成员是指在类中定义的变量&#xff0c;即属性&#xff0c;根据定义位置&#xff0c;又可以分为类属性和实例属性。 类属性定义在方法前面。 定义类属性&#xff0c;非全局变量 class MyClass:#global cc 10 ## 类属性def my_function(self):global qwqw 9print(this …

更改Ubuntu桌面环境

功能异常 1&#xff1a; Ubuntu 22.04 将桌面 .desktop文件&#xff0c;用鼠标拖动到左侧的收藏夹菜单栏&#xff1a;无法实现&#xff0c;且会造成原来的 .desktop文件异常失效。 在多桌面环境下&#xff0c;切换到 KDE桌面&#xff0c;桌面 .desktop文件则是正常 OK的。 都 …