2012年(158)
分类: C/C++
2012-11-20 10:29:50
[2006-01-23补充] (本应写在文章后面)
To
反对者:
假设计算机用浮点数 a_f 来表示实数 a_v,计算机用浮点数 b_f 来表示实数表示 b_v。
c_f 是计算机 a_f 和 b_f
相乘的结果,c_v 是实数 a_v 和 b_v 相乘的结果。
照你所说,就应该是 if( c_f == c_v ± EPSILON
),但请问这个EPSILON应该取值为多少?是0.1,还是1.0E-999?
假如还没有明白的话,我再问一个问题:用你这个EPSILON之后,即使你保证了应该相等的相等了①,但同时如何能保证不应该相等的决不相等②?比如你用
if( 0.3 *3 == 0.9±0.001 )
确实可以输出“0.3*3等于0.9”,但也会输出“0.300001*3等于0.9”,小学生也知道后面一个是不成立的。但如果你把EPSILON写得非常小,使得“0.300001*3不等于0.9”,那么它又会输出“0.3*3不等于0.9”。总之,①和②是不可能同时成立的。
这只是问题之一,问题之二在于浮点数不是定点数,它和实数之间的差并不是一个固定值,何况这里面还包含运算过程中带来的累积差。
--------------------------------------------------------
[期待读者]
使用浮点数格式的语言的用户。(Fortran用户没有这个烦恼)
[前言]
本以为这是一个极其简单和基础的问题,但连续三天分别在三个不同的C/C++论坛遇到这个问题,令我不得不有发通牢骚的责任^_^。
[正文]
在浮点数上自作聪明的使用EPSILON的例子中,最出名的当属林锐博士的《高质量C++/C编程指南》,其开篇第一项就说“float
x 与零值比较的 if 语句”写成“if( x == 0.0f )”是错的,应当写成“if( x>=-EPSILON &&
x<=EPSILON )”。
a. “if( x>=-EPSILON && x<=EPSILON
)”是否是自作聪明的纂改了题意(题意是问是否等于0,而不是问是否接近0),先撇开不谈;
b. “if( x == 0.0f
)”是否有错误(我不知道哪个标准说这句话错了;如果指的是逻辑,我告诉你这种用法也很平常),也先撇开不谈。
撇开a和b不谈,把问题简化为:if(a==b)
是否应当写成 if( fabs(a-b) < EPSILON ) 或类似的形式?
首先问为什么要把if(a==b)写成if( fabs(a-b) < EPSILON
)?别人告诉我理由是浮点数不精确。
对于“不精确”要细细的描述,是什么不精确?是浮点数在计算机内部存储和计算不精确,还是浮点数不能精确的表示现实中的实数?
如果认为是前者的人,return
"回学校重学 数字计算机 和 模拟计算机 那一章";
如果是后者,也就是不认为浮点数在计算机内部存储和计算不精确的人,既然如此,if(a==b) 和
if( fabs(a-b) < EPSILON ) 就同坐一条船,要么都对,要么都错。
还没明白^_^?因为 if( a-b <
EPSILON ) 可以写成 if( a < b+EPSILON ),再把 b+EPSILON 用 c 替代就成了 if( a < c
),如果a不能和c用operator==,那么也就不能用<、>、<=、>=,道理是一样的。
(讲到这里就结束了,下面的事例是为不举例就听不懂的人准备的)
对于浮点数无法使用EPSILON的举证:
1。无法确定EPSILON,或者说唯一合理的EPSILON就是0.0。
假设把EPSILON定义为0.000001,OK!如果
a=0.0000001 请问 a 和 2a 等不等?用if( 2a-a < EPSILON
)来计算它俩就是相等的,明显瞎扯。
有人说这很简单呀,只要把EPSILON定义得更小一点就可以了。错,因为总有比EPSILON更小的可能,所以EPSILON只有可能定义为0,if(
fabs(a-b) < EPSILON
)又等于if(a==b)了。
有人说不要那么吹毛求疵嘛,确定一个平衡些的EPSILON就行了。也错,如果你真能清楚自己当初为什么要把if(a==b)写成if(
fabs(a-b) < EPSILON )的原因的话,就不会有这个蠢提议了,之所以要把if(a==b)写成if( fabs(a-b) <
EPSILON
)原意是因为浮点数是定长定有效位数但不定位的,所以EPSILON也应该是一个变数,而非可以用#define或const定义的常量。
还没明白^_^?回想《计算机基础》上的浮点数在实数轴上的分布点,是不是越接近±0.5-±1.0越密,其间隔是非定长的。
2。现实需求中不存在EPSILON
(因为说了太多次,所以也不说了)
[总结]:浮点数不是定点数,因为不是定点数,所以无法使用EPSILON;意图使用EPSILON来解决浮点数和实数不一致问题的人,其错误本质还是一模一样的,只是换了一种犯错误的形式而已。
[题外话之一]:如何解决浮点数和实数不一致的问题?这本身就属于设计错误,如果你需要的是实数的计算结果,那就不应该使用浮点数来计算。
[题外话之二]:网上也有很多使用EPSILON的算法,但
a.
其算法是固定的,参与计算的数值和结果的范围也是确定的,那么有可能(也只是有可能,并非一切算法都……)存在一个合理的EPSILON,如果它被验证过的话。
b.
如果不是a,那么就一定是从fortran那里照搬过来的,照搬的人不明白浮点数的特性。
[题外话之三]:林锐博士的《高质量C++/C编程指南》开篇第一项一共说了三点,除了上面已经讲过的float和零值比较之外,另外两点也都错误。
a.
“请填写BOOL , float, 指针变量 与“零值”比较的 if
语句”
C/C++中没有BOOL这个字,C中的名_Bool,在stdbool.h中定义为bool;C++中的名bool。不知道他这个BOOL从哪里来的,并说成是《高质量C++/C编程指南》?
b.
“请写出 char *p 与“零值”比较的 if 语句。”
他的答案是 if( p == NULL ),我在一个论坛里说“如果是C++,那就应该写成
if( p == 0 ),写成NULL的人,Bjarne在《The C++ Programming
Language》中为你们哭泣。”
网友评论2012-11-20 10:35:14
云风
EPSILON 不可能是一个固定的值,不过单就浮点数比较的问题,不用 EPSILON 有更方便的方法。
比如两个 double a,b 比较 可以写
(*((__int64*)&a)&~0xf) == (*((__int64*)&b)&~0xf)
:) 就不用考虑 double 的值的数量级了。
前两年我写过篇东西,http://www.codingnow.com/2004/board/view.php?paster=412&reply=0
另外我听过一个讲座有点意思,ppt 在这里。
回复 | 举报
网友评论2012-11-20 10:35:06
vender
to 周星星:
受教,您的观点是有道理的,如果指的“浮点特性”就是这个的话,我了解了。我理解您认为浮点只存在精度不够的问题,而不存在不精确,且范围判断虽然能使“正确的”幸免,但同时也放过了“错误的”,这个我同意。诚然,普适图灵机的基础就是“算法的”,“算法的”的特征就是精确的,不存在不精确的问题
我注意到,这里的逻辑的“不精确”仅仅是我提到的“数学=>计算机实现往往发生连续=>离散的转化”产生的不精确,连续的实数要求无限精度去表示,这个计算机处理不了,咱们人脑可以处理,计算机只能处理离散的信息,这就意味着不可能存在无限精度,是不是意味着对这些问题都放弃不做呢?
无限问题仅仅在数学中存在,现实物理世界却不是无限的(人类认知范围内不是),例如处理长度、时间、温度等等,都会事先给定一个精度,假设某个问题的输入输出值都最多只有小数点后3位的精度,那么可以尝试定义epsilon = 0.0000001,然后用范围去判断,很容易设想这比直接用==去判断要好得多,当然,当输入为?