数据在计算机中的存储——【C语言】

在前面的博客中,我们已经学习了C语言的数据类型,先让我们回顾一下C语言中有哪些数据类型。


目录

C语言的基本内置类型

类型的基本归类

整型在内存中的存储

原码、反码、补码

存储中的大小端

练习 

 浮点型在内存中的存储

 浮点数的存储规则

对引例问题的深度分析 


C语言的基本内置类型

char        //字符型数据类型

short       //短整型数据类型

int           //整型    

long        //长整型

long long//长长整型

float        //单精度浮点型

double    //双精度浮点型

int main(void)
{printf("%d\n", sizeof(char));printf("%d\n", sizeof(short));printf("%d\n", sizeof(int));printf("%d\n", sizeof(long));printf("%d\n", sizeof(long long));printf("%d\n", sizeof(float));printf("%d\n", sizeof(double));return 0;
}

 内置类型的最大取值与最小取值我们也可以大概的了解一下:

这些基本的内置数据类型以及大小,我们已经在熟悉不过了,接下来我们将C语言中的数据类型进行大致归类。


类型的基本归类

 整型家族:

char

        signed char

        unsigned char

short

        signed short [int]

        unsigned short [int]

int

        signed int

        unsigned int

long

        signed long [int]

        unsigned long [int]

我们来细说一下char,char分为signed char和unsigned char分别是有符号的字符型与无符号的字符型,char的大小为8bit,所以有8个二进制位,当为signed char时最高位为符号位,当为unsigned char时全部为数字位。所以signed char 与unsigned char两个类型表示的范围不一样,结果如下:

 当数字大于所能表示的范围时,这个数字将会返回到最开始继续循环。

int、short、long可以参考以上内容。

浮点数家族 :

 float

double

指针家族:

int *p;

char *p;

float *p;

void *p;

......

 构造类型:

数组类型:int arr[10]

结构体类型:struct

联合类型:union

枚举类型:enum

空类型:void 表示空类型(无类型)

通常函数的返回值、函数的参数、指针类型。

以上是我们对整个C语言中的数据类型进行分类整理,接下来我们学一点底层的东西,来加深一下我们对数据的认识和理解!


整型在内存中的存储

在之前的博客中写到,一个变量在创建时需要开辟一块内存空间,而空间的大小就是和数据的类型有关了。

那一个整型变量到底在计算机中是如何储存的呢?

当我们创建一个int a = 10时,计算机将会开辟一个4个字节的空间将数据存储到里面,以二进制的顺序将其存储(vs中的显示是以16进制),也就是32个0或1的组合进行存储。 

原码、反码、补码

计算机中的整数有三种2进制表示方法,即原码、反码和补码。 三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”,而数值位 正数的原、反、补码都相同。 负整数的三种表示方法各不相同。

原码:直接将数值按照正负数的形式翻译成二进制就可以得到原码。

反码:将原码的符号位不变,其余位置按位取反即可。

补码:将得到的补码+1。 

而对于整型数据而言,计算机通常是以补码的形式存储:因为在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统 一处理; 同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程 是相同的,不需要额外的硬件电路。 

我们看一下10与-10的原码、反码、补码

#include<stdio.h>
int main(void)
{int a = 10;// 00000000000000000000000000001010-原码、反码、补码int b = -10;// 10000000000000000000000000001010—原码// 11111111111111111111111111110101-反码// 11111111111111111111111111110110-补码return 0;
}

在与计算机中的存储进行对比,我们可以发现存储的顺序有点不对劲,那这又是为什么呢? 

 


存储中的大小端

什么是大小端呢?

大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址 中。

小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地 址中。 

为什么要进行大小端存储之分呢?

这是因为在计算机系统中,我们是以字节为单位的,每个地址单元 都对应着一个字节,一个字节为8 bit。但是在C语言中除了8 bit的char之外,还有16 bit的short 型,32 bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32 位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如何将多个字节安排的问题。因 此就导致了大端存储模式和小端存储模式。 例如:一个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为 高字节, 0x22 为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在高 地址中,即 0x0011 中。小端模式,刚好相反。我们常用的 X86 结构是小端模式,而 KEIL C51 则 为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式 还是小端模式。

我们怎么区分用程序来区分自己的计算机是大端存储还是小端存储呢?

我们可以利用大小端中存在的差异来进行问题切入,大端与小端的存储方式刚好相反,我们先可以设定一个固定的数值1,然后用指针访问低地址的位置进行打印,如果打印出的数字为1则为小端存储,反之则为大端存储。(创建的变量为int,此时我们只需要访问一个字节的内容,用强制类型转换将变量的地址改为(char *))。理论形成,实践开始!

#include<stdio.h>
int main(void)int check_sys(int a)
{return (*(char*)&a);
}int main(void)
{int i = 1;if (check_sys(i)){printf("小端\n");}else{printf("大端\n");}return 0;
}

练习 

 以上就是整型存储的基本内容,我们可以通过几道练习题来巩固一下:

#include <stdio.h>
unsigned char i = 0;
int main()
{for(i = 0;i<=255;i++){printf("hello world\n");}return 0;
}

我们先来分析这道题:unsigned char可以表示的范围为(0~255)在for循环中i的值要突破255就可以跳出循环,但是i最大能表示的值为255,如果再+1则i的值又会返回到0继续循环,所以这个程序是一个死循环。

#include <stdio.h>
int main()
{char a= -1;signed char b=-1;unsigned char c=-1;printf("a=%d,b=%d,c=%d",a,b,c);return 0;
}
//-1的原反补码
//10000000000000000000000000000001-原码
//11111111111111111111111111111110-反码
//11111111111111111111111111111111-补码

这道题就是区分char 、signed char、unsigned char 所表示的数字的范围。在一般情况下char就是表示signed char所以打印出a和b的值应该一样,都是-1。 对于unsigned char我们先将-1的补码进行截断为11111111,因为打印的格式为%d,所以再将11111111进行无符号整型提升为00000000000000000000000011111111,打印出来应该为255,所以最后打印的结果应该为-1、-1、255。

整型的存储我们看完了,那浮点型我们应该怎么存储呢?


 浮点型在内存中的存储

浮点数也是我们C语言中的老常客了,我们身边就有很多浮点数:3.14、13.14.......上文说过浮点数家族有float、double。

浮点数的范围可以在#include<float.h>中查询。

我们通过一个例子来引入浮点型在内存中的存储:

#include<stdio.h>
int main(void)
{int n = 9;float* pFloat = (float*) & n;printf("n的值为:%d\n", n);printf("*pFloat的值为:%f\n", *pFloat);*pFloat = 9.0;printf("n的值为:%d\n", n);printf("*pFloat的值为:%f\n", *pFloat);return 0;
}

 输出的结果为:

使用一个浮点型指针去解引用一个整型读出来的值和预期不同,而反过来用一个浮点数从内存中取出时,得到的值也不是我们所预期的。从中我们就可以总结出浮点数于整数的存储和读取规则是不同的。那浮点数在内存中应该如何存储呢?


 浮点数的存储规则

根据国际标准IEEE(电气和电子工程协会)754,任意一个二进制浮点数V可以表示成下面的形式:

(-1)^S * M * 2^E

(-1)^S表示符号位,当S=0,V为正数;当S=1,V为负数。

M表示有效数字,大于等于1,小于2。

2^E表示指数位。

举个例子来说:

十进制的5.0,写成二进制是 101.0 ,相当于 1.01×2^2 。 那么,按照上面V的格式,可以得出S=0,M=1.01,E=2。 十进制的-5.0,写成二进制是 -101.0 ,相当于 -1.01×2^2 。那么,S=1,M=1.01,E=2。

IEEE 754规定: 对于32位的浮点数,最高的1位是符号位S,接着的8位是指数E,剩下的23位为有效数字M。 

对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。 IEEE 754对有效数字M和指数E,还有一些特别规定:

 前面说过, 1≤M<2 ,也就是说,M可以写成 1.xxxxxx 的形式,其中xxxxxx表示小数部分。 IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的 xxxxxx部分。比如保存1.01的时 候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。以32位 浮点数为例,留给M只有23位, 将第一位的1舍去以后,等于可以保存24位有效数字。

至于指数E,情况就比较复杂:

 首先,E为一个无符号整数(unsigned int) 这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047。但是,我们 知道,科学计数法中的E是可以出 现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数 是127;对于11位的E,这个中间 数是1023。比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即 10001001。 

然后就是E从内存中取出分为三种情况:

E不全为0或1:

这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将 有效数字M前加上第一位的1。

比如: 0.25(1/4)的二进制形式为0.01,由于规定正数部分必须为1,即将小数点右移2位,则为 1.0*2^(-2),其阶码为-2+127=125,表示为 01111101,而尾数1.0去掉整数部分为0,补齐0到23位00000000000000000000000,则其二进 制表示形式为:00111110100000000000000000000000

E全为0:

这时,浮点数的指数E等于1-127(或者1-1023)即为真实值

有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于 0的很小的数字。

E全为1: 

这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s)


对引例问题的深度分析 

现在我们回过头,再分析一下之前的引例:

9的二进制为00000000000000000000000000001001,为什么转为浮点数九尾0.000000呢? 由于指数E全为0,所以符合上一节的第二种情况。因此,浮点数V就写成:    V=(-1)^0 × 0.00000000000000000001001×2^(-126)=1.001×2^(-146) 显然,V是一个很小的接近于0的正数,所以用十进制小数表示就是0.000000。

我们再来分析一下浮点数转换为整型时出现的问题: 

 得到的十进制整型数就是我们程序所得到的结果。

以上就是数据在计算机中的全部内容,希望大家通过我的文章有所收获,你们的支持是我最大的动力!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/13884.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

css基础知识十八:CSS如何画一个三角形?原理是什么?

一、前言 在前端开发的时候&#xff0c;我们有时候会需要用到一个三角形的形状&#xff0c;比如地址选择或者播放器里面播放按钮 通常情况下&#xff0c;我们会使用图片或者svg去完成三角形效果图&#xff0c;但如果单纯使用css如何完成一个三角形呢&#xff1f; 实现过程似乎…

三、Java的运算符

三、运算符 运算符是一种特殊的符号&#xff0c;用以表示数据的运算、赋值和比较等。 3.1、算术运算符 - * / % (前) (后) (前)-- (后)-- % :取余运算 结果的符号与被模数的符号相同 开发中&#xff0c;经常使用%来判断能否被除尽的情况 3.2、赋值运算符 注意&#xff1a;s2…

哈工大计算机网络课程网络层协议详解之:Internet路由BGP协议详解

哈工大计算机网络课程网络层协议详解之&#xff1a;BGP协议详解 在之前的网络层协议中&#xff0c;我们介绍了Internet网络两个自治系统内的路由协议&#xff1a;RIP协议和OSPF协议。这两个协议应该来说是自治系统内协议的两个代表性协议&#xff0c;前一个基于距离向量路由算…

LabVIEW开发空气动力学实验室的采集和控制系统

LabVIEW开发空气动力学实验室的采集和控制系统 在航空航天模拟设施中&#xff0c;通常的做法是准备一种针对当前正在进行的实验的数据采集和控制软件。该软件通常是根据当前要求编辑的更通用程序的修订版&#xff0c;或者可能是专门为该测试编写的自定义程序&#xff0c;具体取…

mysql重点复习

1.MySQL如何对用户smart授权访问&#xff0c;密码为123456。 2.授权用户tom可以在网络中的192.168.4.254主机登录&#xff0c;仅对对userdb库下的user表有查看记录、更新name字段的权限 &#xff0c; 登录密码userweb888。 GRANT SELECT,UPDATE(name) ON userdb.user TO tom192…

基于matlab使用两个图像估计校准相机的姿势(附源码)

一、前言 运动结构 &#xff08;SfM&#xff09; 是从一组 3-D 图像估计场景的 2-D 结构的过程。此示例演示如何从两个图像估计校准相机的姿势&#xff0c;将场景的三维结构重建为未知比例因子&#xff0c;然后通过检测已知大小的对象来恢复实际比例因子。 此示例演示如何从使…

网络管理(包括网络管理的功能,管理系统及相关协议:SNMP,CMIS/CMIP)

1.OSI定义的网络管理 OSI定义的网络管理功能有以下5大类 (1)性能管理(PerformanceManagement) 在最少的网络资源和最小时延的前提下&#xff0c;网络能提供可靠、连续的通信能力。性能管理的功能有性能检测、性能分析、性能管理、性能控制。 (2)配置管理(ConfigurationManagem…

【Docker】Docker安装MySQL

&#x1f680;欢迎来到本文&#x1f680; &#x1f349;个人简介&#xff1a;陈童学哦&#xff0c;目前专攻C/C、Python、Java等方向&#xff0c;一个正在慢慢前行的普通人。 &#x1f3c0;系列专栏&#xff1a;陈童学的日记 &#x1f4a1;其他专栏&#xff1a;CSTL、蓝桥杯&am…

K个一组反转链表

K个一组反转链表 题目&#xff1a;力扣25 给你链表的头节点 head &#xff0c;每 k 个节点一组进行翻转&#xff0c;请你返回修改后的链表。 k 是一个正整数&#xff0c;它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍&#xff0c;那么请将最后剩余的节点保持原有…

LangChain: 大语言模型的新篇章

本文介绍了LangChain框架&#xff0c;它能够将大型语言模型与其他计算或知识来源相结合&#xff0c;从而实现功能更加强大的应用。接着&#xff0c;对LangChain的关键概念进行了详细说明&#xff0c;并基于该框架进行了一些案例尝试&#xff0c;旨在帮助读者更轻松地理解LangCh…

GIS杂记(二):Arcgis对采样点进行裁剪,获取指定区域内的采样点

有时候需要对栅格数据进行采样处理&#xff0c;如果采样点过多则会使得采样时间过长&#xff0c;今天在进行数据采样时&#xff0c;使用了1km*1km的渔网建立的采样点&#xff0c;大概有1百万个点&#xff0c;程序运行时间大概4个小时&#xff0c;但是其中有绝大部分数据都是空值…

NotePad++ 正则匹配文件路径

([a-zA-Z]:(([\\\\/])[^\\\\/:*?<>|])*([\\\\/])[^\\\\/:*?<>|]\\.[^\\\\/:*?<>|],)*[a-zA-Z]:(([\\\\/])[^\\\\/:*?<>|])*([\\\\/])[^\\\\/:*?<>|]\\.[^\\\\/:*?<>|]$CTRLH -> 标记 -> 输入上面正则匹配&#xff0c;勾选如下…