分类:
2012-10-26 21:45:32
原文地址:C语法陷阱:从变量与函数的声明到类型转换符 作者:DavidOceanHu
程序设计错误,或者你无法按某个算法写出程序,实际上反应的是程序员与该程序与算法的“心智模式”不匹配,或者说,你的心智模式无法包容与理解下该程序算法所包含的思想(如果你不了解心智模式,可以到这里看看:专题)。
比如下面的一个语句:
1 | ( *( void(*)())0)(); |
这是一个什么东西呢?
像这样的表达式恐怕会令大部分C/C++程序员的内心都“不寒而栗”吧。这是一个当计算机启动时,硬件将调用首地址为0位置的子例程。
看不懂也不用担心,这个知识目前处于你学习的“恐慌区”,接下来我们慢慢将它变成你学习的“学习区”,再熟练下,它就会简单成为你学习的“舒适区”了。学习就是这样,不断把“恐慌区”的知识转化成“学习区”,再转化成“舒适区”,你转化得越多,你就越是别人眼里的“大牛”。
从最简单开始,慢慢理解与深入。
最简单的声明任何C变量的都由两部分组成:类型以及一组类似表达式的声明符(declarator)。声明符从表面上看与表达式有些类似,对它求值应该返回一个声明中给定类型的结果。最简单的声明符就是单个变量,如:
1 | float f , g ; |
这个声明的含义是:当对其求值时,表达式f和g的类型为浮点数类型(float)。这个很简单,大家都懂。
因为声明符与表达式的相似,所以我们也可以在声明符中任意使用括号:
1 | float ((f)); |
这个声明的含义是:当对其求值时,((f))的类型为浮点类型,由此可以推知,f也是浮点类型。一个简单的程序例子:
1 | #include "stdio.h" |
2 |
3 | int main() |
4 | { |
5 | float ((f)) = 0.5; |
6 | printf("%.2f", f); |
7 | } |
同样的逻辑也适用于函数和指针类型的声明,例如:
1 | float ff(); |
这个声明的含义是:表达式ff()求值结果是一个浮点数,也就是说,ff是一个返回值为浮点类型的函数。类似地,
1 | float *pf; |
这个声明的含义是*pf是一个浮点数,也就是说,pf是一个指向浮点数的指针。
以上这些形式在声明中还可以组合起来,就像在表达式中进行组合一样。因此,
1 | float *g(), (*h)(); |
表示*g()与(*h)()是浮点表达式。因为()结合优先级高于*,*g()也就是*(g()):g是一个函数,该函数的返回值类型为指向浮点数的指针。同理,可以得出h是一个函数指针,h所指向函数的返回值为浮点类型。
从声明到类型转换符一旦我们知道了如何声明一个给定类型的变量,那么该类型的类型转换符就很容易得到了:只需要把声明中的变量名和声明末尾的分号去掉,再将剩余的部分用一个括号整个“封装”起来即可。例如,因为下面的声明:
1 | float (*h)(); |
表示h是一个指向返回值为浮点类型的函数的指针,因此,
1 | (float (*)()) |
表示一个“指向返回值为浮点类型的函数的指针”的。
拥有了这些预备知识,我们在下一篇就可以分两步来分析表达式 (*(void(*)())0)() 。
第一步,假定变量fp是一个函数指针,那么如何调用fp所指向的函数呢?调用方法如下:
1 | (*fp)(); |
因为fp是一个,那么*fp就是该指针所指向的函数,所以(*fp)()就是调用该函数的方式。ANSI C标准允许程序员将上式简写为fp(),但是一定要记住这种写法只是一种简写形式。
我们平常使用的函数大部分都是简写,请注意到这一点。
在表达式(*fp)()中,*fp两侧的括号非常重要,因为函数运算符()的优先级高于单目运算符*。如果*fp两侧没有括号,那么*fp()实际上与*(fp())的含义完全一致,ANSI C把它作为*((*fp)())的简写形式。
现在,剩下的问题就只是找到一个恰当的表达式来替换fp。我们将在分析的第二步来解决这个问题。如果C编译器能够理解我们大脑中对于类型的认识,那么我们可以这样写:
1 | (*0)(); |
上式并不能生效,因为运算符*必须要一个指针来做操作数。而且,这个指针还应该是一个函数指针,这样经运算符*作用后的结果才能作为函数被调用。因此,在上式中必须对0作类型转换,转换后的类型可以大致描述为:“指向返回值为void类型的函数的指针”。
如果fp是一个指向返回值为void类型的函数的指针,那么(*fp)()的值为void,fp的声明如下:
1 | void (*fp)(); |
因此,我们可以用下式来完成调用存储位置为0的子例程(此处作者假设fp默认初始化为0):
1 | void (*fp)(); |
2 | (*fp)(); |
这种写法的代价是多声明了一个“哑”变量。
但是,我们一旦知道如何声明一个变量,也就自然知道如何对一个常数进行,将其转型为该变量的类型:只需要在变量声明中将变量名去掉即可。因此,将常数0转型为“指向返回值为void的函数的指针”类型,可以这样写:
1 | (void (*)())0 |
因此,我们可以用(void (*)())0来替换fp,从而得到:
1 | (*(void (*)())0)(); |
末尾的分号使得表达式成为一个语句。
在我当初解决这个问题的时候,C语言中还没有typedef声明。尽管不用typedef来解决这个问题对剖析本例的细节而言是一个很好的方式,但无疑使用typedef能够使表述更加清晰:
1 | typedef void (*funcptr)(); |
2 |
3 | (*(funcptr)0)(); |
这个棘手的例子并不是孤立的,还有一些C程序员经常遇到的问题,实际上和这个例子是同一个类型的。例如,考虑signal库函数,在包括该函数的C编译器实现中,signal函数接受两个参数:一个是代表需要“被捕获”的特定signal的整数值;另一个是指向用户提供的函数的指针,该函数用于处理“捕获到”的特定signal,返回值类型为void。
一般情况下,程序员并不主动声明signal函数,而是直接使用系统头文件signal.h中的声明。那么,在头文件signal.h中,signal函数是如何声明的呢?
首先,让我们从用户定义的信号处理函数开始考虑,这无疑是最容易解决的。该函数可以定义如下:
1 | void sigfunc(int n){ |
2 | /* 特定信号处理部分*/ |
3 | } |
函数sigfunc的参数是一个代表特定信号的整数值,此处我们暂时忽略它。
上面假设的函数体定义了sigfunc函数,因而sigfunc函数的声明可以如下:
1 | void sigfunc(int ); |
现在假定我们希望声明一个指向sigfunc函数的指针变量,不妨命名为sfp。因为sfp指向sigfunc函数,则*sfp就代表了sigfunc函数,因此*sfp可以被调用。又假定sig是一个整数,则(*sfp)(sig)的值为void类型,因此我们可以如下声明sfp:
1 | void (*sfp)(int); |
因为signal函数的返回值类型与sfp的返回类型一样,上式也就声明了signal函数,我们可以如下声明signal函数:
1 | void (*signal(something))(int); |
此处的something代表了signal函数的参数类型,我们还需要进一步了解如何声明它们。上面声明可以这样理解:传递适当的参数以调用signal函数,对signal函数返回值(为函数指针类型)解除引用(dereference),然后传递一个整型参数调用解除引用后所得函数,最后返回值为void类型。因此,signal函数的返回值是一个指向返回值为void类型的函数的指针。
那么,signal函数的参数又是如何呢?signal函数接受两个参数:一个整型的信号编号,以及一个指向用户定义的信号处理函数的指针。我们此前已经定义了指向用户定义的信号处理函数的指针sfp:
1 | void (*sfp)(int); |
sfp 的类型可以通过将上面的声明中的sfp去掉而得到,即void (*)(int)。此外,signal函数的返回值是一个指向调用前的用户定义信号处理函数的指针,这个指针的类型与sfp指针类型一致。因此,我们可以如下声明signal函数:
1 | void (*signal(int, void(*)(int)))(int); |
同样地,使用typedef可以简化上面的函数声明:
1 | typedef void (*HANDLER)(int); |
2 | HANDLER signal(int, HANDLER); |