Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1205036
  • 博文数量: 322
  • 博客积分: 10010
  • 博客等级: 上将
  • 技术积分: 3276
  • 用 户 组: 普通用户
  • 注册时间: 2009-12-17 09:21
文章分类

全部博文(322)

文章存档

2010年(155)

2009年(167)

我的朋友

分类: 嵌入式

2009-12-19 10:28:36

程序的执行流程是由条件判断、跳转和循环构成的,没有任何一个程序会缺少程序流的控制。那么像if 、for 、while 、switch 等这些程序员无比熟悉的语句也存在隐患吗? 事实上,C 语言是很灵活的,这种灵活性给程序员编写代码带来了很多便利,但同时也带来了很多容易导致混淆的表达。这些表达完全符合C 语言标准,但有时程序员也难以发现自己犯了错误,最终的结果是使程序进入错误的执行流程。即使程序员没有犯错误,但有些容易混淆的表达也会给其他人读懂程序带来困扰,使程序的维护变得困难。除此以外,有少量控制流程的方式还会产生不确定的运行结果,而这些结果也不容易被发觉。

如何使程序的流程控制清晰、准确,不产生混淆的表达呢? MISRA C 给出了很多的相关规定,使程序流的控制变得规范,避免产生各种混淆和不确定性,从而最大程度上减少程序流控制中的失误, 并使程序的维护更加容易。

下面从几个例子出发,讲述这些混淆是如何产生的,最后给出MISRA C 关于程序流控制的相关规则,帮助读者规范编程的习惯。

1  容易混淆的表达方式

先来看这样两段代码:
uint8_t x ,y ;

if ( x = = y) {
    foo ( ) ;
}
uint8_t x ,y ;

if (x = y) {
    foo ( ) ;
}

在C 标准中,条件语句需要的是布尔值,条件语句表达式的布尔值实际上是按照整型处理的,所以这两段代码在语法和逻辑上都没有任何问题。第一段代码判断x 是否等于y ,如果相等,调用foo () 函数;第二段代码首先将y的值赋给x ,然后判断x 是否为0 ,如果不为0 ,调用foo ()函数。这两段代码只相差一个等号,却使判断条件大不相同,程序的执行流程会出现很大差别。

相信读者在写程序的时候都碰到过将“= = ”这个判断语句误写成赋值语句“= ”的情况。那么面对这两个语句时,如何能快速准确地判断这是正确的还是程序员的失误呢? 当程序比较简单的时候,很容易判断,但当程序流程比较复杂的时候,可能花费大量时间还难以给出确定的答案,而这些地方极有可能是有错误的。

这样的混淆,事实上是可以轻松避免的,MISRA C提出了如下强制性的规则。

规则13. 1 :赋值表达式不能用在需要布尔值的地方。
按照MISRA C 的标准,第二段代码应该写成:
uint8_t x ,y ;

x = y ;
if (x ! = 0) {
    foo ( ) ;
}
这样,当看到需要布尔值的地方出现了赋值表达式,
就可以立即判断这是一个错误。在这条规则下,如下的表达也是不允许的:
if ( (x = y) ! = 0 ) ) {
    foo ( ) ;
}

与这条规则类似,MISRA C 还提出了如下推荐的规则,来避免整型变量和布尔型的混淆。
规则13. 2 (推荐) :判断一个值是否为0 应该是显式的,除非该操作数是一个布尔值。
这条规则禁止了如下的表达:
uint8_t x ;

if ( x )
{ ⋯}
再来看一个例子:
uint8_t x ;
uint8_t a ,b ;

switch ( x ) {
    case 1 :
        a = b ;
    case 2 :
        a + = 2 ;
        break ;
    case 3 :
    ⋯
}
同样,这段代码在语法和逻辑上也没有任何问题,编译器也不会给出任何错误或者警告。在程序执行中,当x等于1 的时候,将b 的值赋给a ,然后将a 加2 ,退出;当x等于2 的时候,直接将a 的值加2 ,接着退出。但这儿很可能是一段错误的代码,程序员的本意有可能是x 等于1时,将b 的值赋给a ,当x 等于2 时,直接将a 的值加2 。
为了避免这样的混淆,MISRA C 提出了如下强制性的规则。

规则15. 2 :所有非空的switch 子句都应该以break 语句结束。
按照这条规则,上面的程序应该写成:

switch ( x ) {
    case 1 :
        a = b ;
        break ;
    case 2 :
        a + = 2 ;
        break ;
    case 3 :
        ⋯
}
或者:
switch ( x ) {
    case 1 :
        a = b ;
        a + = 2 ;
        break ;
    case 2 :
        a + = 2 ;
        break ;
    case 3 :
    ⋯
}

MISRA C 中还有一些防止程序流控制中出现混淆的规则。

规则13. 5 :for 语句中的3 个表达式只能和循环控制相关。第一个表达式只能为循环变量赋初值,第二个表达式只能进行循环条件的判断,第三个表达式只能进行循环
变量增(减) 值。


规则13. 6 :for 循环中,循环变量只能在for 语句的第三个表达式中修改,不允许在循环体中修改。

规则13. 7 :布尔表达式的值必须是可以改变的。
例如,如下代码是不允许的:
uint8_t x ;

if ( x > = 0 )

错误在于该条件判断的结果始终为真。

规则14. 1 :不能存在无法执行到的代码。

规则14. 2 : 非空语句必须要么产生副作用( side-effect) (副作用是指表达式执行后对程序运行环境造成的影响。赋值语句、自
增操作等都是典型的具有副作用的操作。) ;或者使程序流程改变。
例如,下面的代码是不允许的:

x > = 3 ;


错误在于x 和3 比较的结果被丢弃了。

规则14. 3 :一行中如果有空语句,那么该行只能有这条空语句,不能有别的语句,并且在这条空语句前不能有注释,注释必须在其后,用空格隔开。
例如,如下的代码都是不允许的:
while (port & 0x80 = = 0) {
; foo ( ) ; ①
/ * wait for pin * / ; ②
;/ * wait for pin * / ③
}

其中
的错误是除了空语句还有一条语句;
②的错误是在空语句前有注释;
③的错误是空语句与注释没用空格隔开。


规则14. 8 : switch 、while 、do. . . while 和for 语句的主体必须是复合语句(即用大括号包含) ,即使该主体只包含一条语句。
例如,如下代码是符合MISRA C 标准的:
for ( i = 0 ;i < N_EL EMEN TS ; + + i )
{
    buffer [ i ] = 0 ;
}

规则14. 9 :if 结构后面必须是一个复合语句(即用大括号包含) ,else 后面必须是一个复合语句(即用大括号包含) 或者另一个if 语句。

规则15. 1 : switch 语句的主体必须是复合语句(即用大括号包含) 。

规则15. 2 :所有非空的switch 子句都应该用break 语句结束。

规则15. 3 : switch 的最后一个子句必须是default 子句,如果default 中没有包含任何语句,那么应该有注释来说明为什么没有进行任何操作。

规则15. 4 : switch 表达式不能是一个有效的布尔值。
例如,下面的代码是不允许的:
switch ( x = = 0 )
{ ⋯}

规则15. 5 : switch 语句必须至少包含一个case 子句。



2  导致混乱的表达方式
在C 语言中,有一些表达方式可以使程序的代码量减少,但却会使程序的结构化程度降低,流程控制变得混乱,可读性大大降低。看下面一段代码:
if ( a > 0x02 )
{
    loop1 : b + = 1 ;
    if ( c > 0xA0 ) {
        goto loop3 ;
    }

    loop2 : a = 2 3 b ;
    c = a + b ;
    if ( c < 0x40) {
        goto loop1 ;
    }el se {
        goto loop2 ;
    }
}

loop3 : ⋯

这段代码读起来很困难。实际编程时,程序员实现这段功能的代码自然不会这样写,但是当程序流程复杂的时候,各种看起来能使编程工作变得轻松的表达,例如goto 、continue 等语句,却会使程序流程变得混乱,可读性降低,而隐藏其中的问题,很可能就无法发现了。

针对这种情况, MISRA C 给出了下面几条强制规则。


规则14. 4 :不允许使用goto 语句。

规则14. 5 :不允许使用continue 语句。

规则14. 6 :循环体中最多只能出现一个break 语句用于结束循环。

规则14. 7 :函数只能有一个出口,这个出口必须在函数末尾。

规则14. 10 : if . . . else if 结构必须由一个else 子句结束。

当if 语句后面有一个或者多个else if 语句时,最后的一个else if 必须有一个与之对应的else 语句。如果只有一个if 语句时,else 不是必须的。


3  不确定的执行结果

除了导致混淆和混乱的表达外,还有一些对浮点数的操作会导致不确定的结果。来看如下一段代码:
float32_t x ,y ;
⋯ / 3 一些运算3 /
if ( x = = y )
{ ⋯}

if 的条件无法肯定什么情况为真。这是因为浮点数在计算机中无法用二进制精确表示,其运算总会存在舍入和切断误差,很多人看起来相等的结果,但计算机给出的两个浮点数并不相等,所以上面代码中if 的主体语句什么情况执行是不确定的。MISRA C 给出了两条相关的规定来解决这一问题。

规则13. 3 :不允许对浮点数进行相等或者不相等的比较,即使是非直接的比较也是不允许的。
例如,如下非直接的比较也是不允许的:
float32_t x ,y ;

if ( x < = y )
{ ⋯}
规则13. 4 :for 循环的控制表达式不应包含浮点数类型。


4  小 结

好的代码,要安全可靠、有很好的可读性和可维护性。在C 语言中,一些表达方式,可能会稍微减少程序员编程的工作量,但却会使程序的流程变得难以判断,其中的错误可能就无法发现。

按照MISRA C 的标准来写代码,就可以避免程序流程产生混淆和混乱,排除其中的不确定因素,使程序真正按照程序员设想的工作,并使代码更清晰易懂,真正实现安全可靠,并具有良好的可读性和可维护性。

参考文献
1  MISRA C:2004 ,Guidelines for the use of the C language in critical systems. The Motor Indust ry Software Reliability As2sociation ,2004
2  Harbison III. Samuel P , Steele J r. Guy L. C 语言参考手册,
邱仲潘,等译,第5 版. 北京:机械工业出版社,2003
3  Les Hatton. The MISRA C Compliance Suite The next step , Oakwood Computing. http :/ / www. misra c2. com/
4  ISO/ IEC 9899 :1999. International Organization of Standardi2zation , 1999
阅读(619) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~