浮点数在内存中的储存方式是按IEEE 754标准的
(-1)的S次方*M*2的E次方
即(-1)^S*M*2^E
( S是0或1,用来表示正负,0为正,1为负)
[M是浮点数转化为二进制后的二进制科学计数法的小数部分,所以M的取值范围为1<=M<2]
2^E是浮点数转化为二进制后的二进制科学计数法的指数部分
例
5.0的二进制是101.0
它的二进制用科学计数法表示为
(-1)^0*1.01*2^2
因为它小数点往左移动了两位。
此处可类比于10进制的科学计数法。
比如十进制的101的科学计数法为1.01*10^2
float类型和double类型中M,E,S所占字节数
float:
S的值只有0和1,所以占一个比特位就可以
E占8个比特位,E被定义为无符号数,所以E的范围为0~255
M占23个比特位
double:
S的值也只有0和1,所以占一个比特位就可以
E占11个比特位,double的E也是无符号数,所以E的范围为0~2047
M占52个比特位
浮点数小数点后的数的表示
浮点数的小数点后数的二进制表示是以2的-k加出来的
即 浮点数的小数的二进制表示是1(或0)*2的-k + 1(或0)2的-(k+1)
所以9.5的二进制表示为1001.1
因为以上的表示方式,所以有一些浮点数在二进制中是不能精确保存的,因为凑不出二的几次方加二的几次方,正好等于小数点后的那几个数。
科学计数法的小数部分M的特别规定
IEEE 754对有效数字M和指数E,还有一些特别规定。 前面说过 1<=M<2, 也就是说,M可以写成1. xxxxxx的形式,其中xxxxx表示小数部分。 IEEE 754规定,在计算机内部保存M时,默认这个数的第一 位总是1
因此可以被舍去,只保存后面的xxxxxx部分
比如保存1.01的时候,只保存01,等到读取的时候,再把第一位的1加上去。 这样做的目的,是节省1位有效数字。
以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字
指数E的特别规定
首先,E为一个无符号整数(unsigned int)
这意味着,如果E占8个比特位(fioat),它的取值范围为0~255;
如果E占11个比特位(double),它的取值范围为0~2047.
但是我们知道,科学计数法中的E是可以出现负数的
所以IEEE 754规定,
存入内存时E(无论正负)的真实值必须再加上一个中间数,计算时再减去中间值
对于8位的E,这个中间数是127
对于11位的E,这个中间数是1023
比如,2^10的E是10, 所以保存成32位浮点数时,E必须保存成10+127=137 即二进制的
10001001。
因为中间值的特点,有以下两种特殊请况
E的二进制的比特位中全为0
这时,浮点数的指数E的真实值等于-127 (或者-1023)
有效数字M不再加上第一位的1, 而是还原为0.*xxxx的小数。
这样做是为了表示+1~0,以及接近于0的很小的数字。
E的二进制的比特位中全为1
这时, 如果有效数字M全为0,表示+/-无穷大(正负取决于符号位s) ;