浮点数和 EPSILON （文章越写越啰嗦）-bruceteen-ChinaUnix博客

bruceteenbruceteen.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

bruceteen

博客访问： 988558
博文数量： 158
博客积分： 4380
博客等级：上校
技术积分： 2367
用户组：普通用户
注册时间： 2006-09-21 10:45

文章分类

全部博文（158）

未分配的博文（158）

文章存档

2012年（158）

我的朋友

CU官方博

相关博文

浮点数和 EPSILON （文章越写越啰嗦）

分类： C/C++

2012-11-20 10:29:50

[2006-01-23补充] （本应写在文章后面）
To 反对者：
假设计算机用浮点数 a_f 来表示实数 a_v，计算机用浮点数 b_f 来表示实数表示 b_v。
c_f 是计算机 a_f 和 b_f 相乘的结果，c_v 是实数 a_v 和 b_v 相乘的结果。
照你所说，就应该是 if( c_f == c_v ± EPSILON )，但请问这个EPSILON应该取值为多少？是0.1，还是1.0E-999？
假如还没有明白的话，我再问一个问题：用你这个EPSILON之后，即使你保证了应该相等的相等了①，但同时如何能保证不应该相等的决不相等②？比如你用 if( 0.3 *3 == 0.9±0.001 ) 确实可以输出“0.3*3等于0.9”，但也会输出“0.300001*3等于0.9”，小学生也知道后面一个是不成立的。但如果你把EPSILON写得非常小，使得“0.300001*3不等于0.9”，那么它又会输出“0.3*3不等于0.9”。总之，①和②是不可能同时成立的。
这只是问题之一，问题之二在于浮点数不是定点数，它和实数之间的差并不是一个固定值，何况这里面还包含运算过程中带来的累积差。

--------------------------------------------------------

[期待读者] 使用浮点数格式的语言的用户。（Fortran用户没有这个烦恼）
[前言] 本以为这是一个极其简单和基础的问题，但连续三天分别在三个不同的C/C++论坛遇到这个问题，令我不得不有发通牢骚的责任^_^。
[正文]
在浮点数上自作聪明的使用EPSILON的例子中，最出名的当属林锐博士的《高质量C++/C编程指南》，其开篇第一项就说“float x 与零值比较的 if 语句”写成“if( x == 0.0f )”是错的，应当写成“if( x>=-EPSILON && x<=EPSILON )”。
a. “if( x>=-EPSILON && x<=EPSILON )”是否是自作聪明的纂改了题意（题意是问是否等于0，而不是问是否接近0），先撇开不谈；
b. “if( x == 0.0f )”是否有错误（我不知道哪个标准说这句话错了；如果指的是逻辑，我告诉你这种用法也很平常），也先撇开不谈。
撇开a和b不谈，把问题简化为：if(a==b) 是否应当写成 if( fabs(a-b) < EPSILON ) 或类似的形式？

首先问为什么要把if(a==b)写成if( fabs(a-b) < EPSILON )？别人告诉我理由是浮点数不精确。
对于“不精确”要细细的描述，是什么不精确？是浮点数在计算机内部存储和计算不精确，还是浮点数不能精确的表示现实中的实数？
如果认为是前者的人，return "回学校重学数字计算机和模拟计算机那一章"；
如果是后者，也就是不认为浮点数在计算机内部存储和计算不精确的人，既然如此，if(a==b) 和 if( fabs(a-b) < EPSILON ) 就同坐一条船，要么都对，要么都错。
还没明白^_^？因为 if( a-b < EPSILON ) 可以写成 if( a < b+EPSILON )，再把 b+EPSILON 用 c 替代就成了 if( a < c )，如果a不能和c用operator==，那么也就不能用<、>、<=、>=，道理是一样的。
（讲到这里就结束了，下面的事例是为不举例就听不懂的人准备的）

对于浮点数无法使用EPSILON的举证：
1。无法确定EPSILON，或者说唯一合理的EPSILON就是0.0。
假设把EPSILON定义为0.000001，OK！如果 a=0.0000001 请问 a 和 2a 等不等？用if( 2a-a < EPSILON )来计算它俩就是相等的，明显瞎扯。
有人说这很简单呀，只要把EPSILON定义得更小一点就可以了。错，因为总有比EPSILON更小的可能，所以EPSILON只有可能定义为0，if( fabs(a-b) < EPSILON )又等于if(a==b)了。
有人说不要那么吹毛求疵嘛，确定一个平衡些的EPSILON就行了。也错，如果你真能清楚自己当初为什么要把if(a==b)写成if( fabs(a-b) < EPSILON )的原因的话，就不会有这个蠢提议了，之所以要把if(a==b)写成if( fabs(a-b) < EPSILON )原意是因为浮点数是定长定有效位数但不定位的，所以EPSILON也应该是一个变数，而非可以用#define或const定义的常量。
还没明白^_^？回想《计算机基础》上的浮点数在实数轴上的分布点，是不是越接近±0.5-±1.0越密，其间隔是非定长的。
2。现实需求中不存在EPSILON
（因为说了太多次，所以也不说了）

[总结]：浮点数不是定点数，因为不是定点数，所以无法使用EPSILON；意图使用EPSILON来解决浮点数和实数不一致问题的人，其错误本质还是一模一样的，只是换了一种犯错误的形式而已。

[题外话之一]：如何解决浮点数和实数不一致的问题？这本身就属于设计错误，如果你需要的是实数的计算结果，那就不应该使用浮点数来计算。

[题外话之二]：网上也有很多使用EPSILON的算法，但
a. 其算法是固定的，参与计算的数值和结果的范围也是确定的，那么有可能（也只是有可能，并非一切算法都……）存在一个合理的EPSILON，如果它被验证过的话。
b. 如果不是a，那么就一定是从fortran那里照搬过来的，照搬的人不明白浮点数的特性。

[题外话之三]：林锐博士的《高质量C++/C编程指南》开篇第一项一共说了三点，除了上面已经讲过的float和零值比较之外，另外两点也都错误。
a. “请填写BOOL , float, 指针变量与“零值”比较的 if 语句”
C/C++中没有BOOL这个字，C中的名_Bool，在stdbool.h中定义为bool；C++中的名bool。不知道他这个BOOL从哪里来的，并说成是《高质量C++/C编程指南》？
b. “请写出 char *p 与“零值”比较的 if 语句。”
他的答案是 if( p == NULL )，我在一个论坛里说“如果是C++，那就应该写成 if( p == 0 )，写成NULL的人，Bjarne在《The C++ Programming Language》中为你们哭泣。”

阅读(6499) | 评论(36) | 转发(0) |

上一篇：VC2005中的 TEXT 宏的一个问题

下一篇：VS2005中enum的bug

给主人留下些什么吧！~~

网友评论2012-11-20 10:34:16

好人
这个问题就好似我们在计算中如何带入圆周率的问题，完全是看计算精度，所以说浮点数的比较只要符合程序所需要的精度即可，加之很多时候（基本可以说是全部），比较2个浮点数的精度根本不需要到计算机中能表述的浮点数有效数字的最末位，所以一般程序中都会使用到相近比较来确定是否相等

回复 | 举报

网友评论2012-11-20 10:34:02

pAnic
呵呵，星星是语法高手～

回复 | 举报

网友评论2012-11-20 10:33:53

Panic
看偶关于magic number的随笔：

http://blog.vckbase.com/panic/archive/2006/01/21/17229.html

回复 | 举报

网友评论2012-11-20 10:33:40

Panic
to pAnic: "建议用NULL代替直接的0，除了C语言的因素外，多半是基于一个不使用magic number的理由"
—— 给你个× 。

magic number 一般指除0和1之外的literal number。
证据：Brain W.Kernighan 写的《The Practice of Programming》的第1.5节。

：）

我觉得你理解有误，magic number是指当一个数字并非表达其数值自身，所谓的表达数字自身，是指这样一种情况：
for(int i = 0;//是的，i等于0,i是一个初始值为0的整型变量，这个是明确的。

而不表达数字自身，例如：
switch(result)
{
case 0://....
//....
这种情况，0多半是表示某个特定的返回

回复 | 举报

网友评论2012-11-20 10:33:27

vender
to 乾坤一笑：
您好，我翻看了我的言论，从没提到“float不用EPSILON就没法跟0比”这个观点，仅仅是说“存在不用EPSILON就没法跟字面常数或者其他浮点数比”的情况，那么在难以预料时，我们选择什么呢？我认为EPSILON范围比较法虽不确定，但反而准确，逻辑上准确

重申一下观点，浮点运算我所知有限，简而言之，目前我对浮点的知识是：

ieee规范浮点表示把其他进制字面值转化为二进制m * 2 ^ n的方式，m是型为1.????或-1.????的二进制定点数，存储时只存????部分，n为有符号整数，数的符号占一个二进制位，浮点数分为几种精度，原理类似，只是有效位数不同（记忆久远，没及查实，有谬误还望指正）

于是可以看到，第一步就存在着其他进制到二进制转换的问题，前面提到了，只有能表示成2 ^ n的有限多项式且由其权值们转换的二进制数定点部分和幂部分都不超出有效表示范围才能精确被表示。另外运算也可能导致新的精度损失

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6