尘世中一个迷途小书童riverhwp.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

Larpenteur

博客访问： 6459063
博文数量： 2759
博客积分： 1021
博客等级：中士
技术积分： 4091
用户组：普通用户
注册时间： 2012-03-11 14:14

文章分类

全部博文（2759）

Todo（1）
Advice（151）
Linux-未分类（223）
Ubuntu（47）
Database（145）
算法&DS（77）
Android（47）
Web（214）
Geek（237）
CPPC（296）
Java（113）
Python（99）
Matlab（19）
Git（19）
SVN（11）
Gnuplot（5）
面试（0）
机器-挖掘-AI（6）
开源项目（1）
Happy Drawe（9）
Programming（144）

Tools（23）

Shell（66）

Makefile（11）

GDB（26）

vim（18）
System（628）

Author（110）

Common（4）

Memory（66）

File system（82）

Driver（19）

IO（66）

Storage（45）

General（38）

Architecture（19）

Command（64）

Kernel（115）
Virtualization（39）
Cloud（33）
Hadoop（71）
Big Data（24）
未分配的博文（100）

文章存档

2019年（1）

2017年（84）

2016年（196）

2015年（204）

2014年（636）

2013年（1176）

2012年（463）

我的朋友

从一个笔试题看C语言中float向double的提升问题

——lvyilong316

首先看一段来自一个笔试题的程序段：

float f=1.1;

double d=1.1;

cout<<(f==d)< //0

这段代码输出0，那么为什么同为1.1的doble和float不相等呢？

我们知道float和double比较的时候后发生类型提升，也就是float会提升为double。我们先来看一下这样的情况：

float f=1.1;

double d=1.1;

double d1=f;

可以发现当由float提升到double后值发生了变化，这究竟是怎么回事呢？我们可以看一下这几个数字的十六进制表示，修改程序如下：

点击(此处)折叠或打开

void show_bytes(unsigned char* start,int len)
{
for(int i=0;i<len;i++)
printf("%x ",start[i]);
printf("\n");
}
int _tmain(int argc, _TCHAR* argv[])
{
float f=1.1;
show_bytes((unsigned char*)&f,sizeof(f));
double d=1.1;
show_bytes((unsigned char*)&d,sizeof(d));
double d1=f;
show_bytes((unsigned char*)&d1,sizeof(d1));
return 0;
}

输出结果：

输出结果分别为f、d、d1的十六进制表示，由于所用机器是32位小端方式存放字节，所以这三个数的十六进制表示应为：

f=0x3f 8c cc cd;

d=0x3f f1 99 99 99 99 99 9a;

d1=0x3f f1 99 99 a0 0 0 0;

下面按照IEEE 754的标准对三个数的二进制进行分析：

l f=0011 1111 1000 1100 1100 1100 1100 1101

对于单精度浮点数：

(1) 符号s 1位：0代表整数；

(2) 阶码E 8位：01111111代表0；(注意阶码的表示方式：对于e的为模式既不全为0也不全为1的情况，E=e-Bias，Bias为2k-1-1，对于单精度是127，双精度是1023)

(3) 尾数M 23位：000 1100 1100 1100 1100 1101代表1+2-4+2-5+2-8+….(注意尾数的表示方式M=1+f，f=0.fn-1…f1f0)

所以这个数的实际值为。

l d=0011 1111 1111 0001 1001 1001 1001 1001 1001 1001 1001 1001 1001 1001 1001 1010

对于双精度浮点数：

(1) 符号s 1位：0代表整数；

(2) 阶码E 11位：01111111111代表0；(注意阶码的表示方式：对于e的为模式既不全为0也不全为1的情况，E=e-Bias，Bias为2k-1-1，对于单精度是127，双精度是1023)

(3) 尾数M 52位：0001 1001 1001 1001 1001 1001 1001 1001 1001 1001 1001 1001 1010代表1+2-4+2-5+2-8+….(注意尾数的表示方式M=1+f，f=0.fn-1…f1f0)，可以看出双进度的尾数要比单精度尾数更加精确。

所以这个数的实际值也为。

但是要注意虽然d和f都约为1.1，但实际值是不相等的，d要比f更加接近于1.1，因为d的尾数有更高的精度。

l d1=0011 1111 1111 0001 1001 1001 1001 1001 1010 0000 0000 0000….

对于双精度浮点数：

(1) 符号s 1位：0代表整数；

(2) 阶码E 11位：01111111111代表0；(注意阶码的表示方式：对于e的为模式既不全为0也不全为1的情况，E=e-Bias，Bias为2k-1-1，对于单精度是127，双精度是1023)

(3) 尾数M 52位：0001 1001 1001 1001 1001 1010 0000 0000 0000….代表1+2-4+2-5+2-8+….(注意尾数的表示方式M=1+f，f=0.fn-1…f1f0)。

重点出现了：可以看出d1的阶码的值和f、d都是一样的，但是尾数M和d不同，对比f的尾数000 1100 1100 1100 1100 1101发现和d1的值是相同的，只是后面补了些0。也就是说float提升为double数的精度并没有提高(值没变),既然精度没有提高那和d肯定是不相等的，因为d比f和d1有更高的精度，更接近于1.

为了验证float提升为double后值没有改变，有如下语句：

cout<<(d1==f)< //输出1

同时我们可以得到如下结论：

(1) float提升为double，是对阶码E和尾数M的扩展；

(2) 阶码E和尾数M的扩展方式都按照”保持值不变”的原则扩展。

(3) float提升为double后值保持不变，精度不增加。

有了以上结论，我们将上述程序中的1.1改为1.5,猜想下f、d、d1之间相等吗？代码如下：

点击(此处)折叠或打开

int _tmain(int argc, _TCHAR* argv[])
{
float f=1.5;
show_bytes((unsigned char*)&f,sizeof(f));
double d=1.5;
show_bytes((unsigned char*)&d,sizeof(d));
double d1=1.5;
show_bytes((unsigned char*)&d1,sizeof(d1));
cout<<(d==d1)<<endl;
cout<<(f==d)<<endl;
return 0;
}

运行结果：

可以看到f、d、d1都是相等的，因为1.5用浮点数是可以精确表示的，所以float的1.5和double的1.5都是准确的1.5，所以float提升为double依然是准确的1.5，当然三个数相等。而float的1.1提升为double后和double的1.1不等的原因归根结底是因为1.1不能用浮点数精确表示，float的1.1和double的1.1就不想等，float提升后值不变依然不等。

阅读(1061) | 评论(0) | 转发(0) |

上一篇：LinkedHashMap和HashMap区别

下一篇：话说网站压力测试

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6