不浮躁
分类:
2014-12-09 21:20:48
原文地址:GNU C与ANSI C 作者:xutianxi
LINUX系统上可用的C编译器是GNU C编译器,它建立在自由软件基金会的编程许可的基础上,因此可以自由发布。GNU C对标准C进行了一系列的扩展,以增强标准C的功能。
1、零长度数组
GNU C允许使用零长度数组,在定义变长对象的头结构时,这个特性特别有用。例如:
struct var_data
{
int len;
char data[0];
};
char data[0]仅仅意味着程序中通过var_data结构实例的data[index]成员可以访问len之后的第index个地址,它并没有为data[]数组分配内存,因此sizeof(struct var_data)=sizeof(int).
假设struct var_data的数据域保存在struct var_data紧接着的内存区域,通过如下代码可以遍历这些数据:
struct var_data s;
...
for(i = 0;i < s.len;i++)
{
printf("%02x",s.data[i]);
}
2.case 范围
GNU C支持case x...y这样的语法,区间[x,y]的数都会满足这个case的条件,请看下面的代码:
switch(ch)
{
case '0'...'9':c -= '0';
break;
case 'a'...'f':c -= 'a';
break;
}
代码中的case '0'...'9'等价于标准C中的如下代码:
case '0':
case '1':
...
case '9':
3.语句表达式
GNU C把包含在括号中的复合语句看做是一个表达式,称为语句表达式,它可以出现在任何允许表达式的地方。我们可以在语句表达式中使用原本只能在复合语句中使用的循环变量、局部变量等,例如:
#define min_t(type,x,y) \
({ type __x = (x);type __y = (y); __x < __y ? __x : __y;})
int ia,ib,mini;
float fa,fb,minf;
mini = min_t(int ,ia ,ib);
minf = mini_t(float ,ia, ib);
因为重新定义了__x,__y这两个局部变量,所以以上述方式定义的宏将不会产生副作用。在标C中,对应的如下宏则会产生副作用:
#define min(x,y) ((x)<(y)?(x):(y))
代码min(++ia,++ib)会被展开为((++ia) < (++ib)?:(++ia):(++ib)),传入的宏的参数被增加了两次。
4、typeof关键字
typeof(x)语句可以获得x的类型,因此,我们可以借助typedef重新定义min这个宏:
#define min(x,y)\
(const typeof(x) __x = (x); \
(const typeof(y) __y = (y); \
(void)(&__x == &__y);
__x < __y ? __x :__y;})
我们不需要像min_t(type,x,y)这个宏那样把type传入,因为通过关键字就可以获得type。代码行 (void)(&__x == &__y);作用是检查__x,__y类型是否一致!
5、可变参数的宏
标C只支持可变参数的函数,意味着函数的参数是不固定的,例如printf()函数原型:
int printf( const char *format[,argument]...);
而在GNU C中,宏也可以接受可变数目的参数,例如:
#define pr_debug(fmt,arg...) \
printk(fmt,##arg)
这里的arg表示其余的参数可以是零个或多个,这些参数以及参数之间的逗号构成arg的值,在宏扩展时替换arg,例如下列代码:
pr_debug("%s:%d",filename,line)
会被扩展为:
printk("%s:%d",filename,line)
使用##的原因是处理arg不代表任何参数的情况,这时候,前面的逗号就变得多余了。使用##之后,GNU C预处理器会丢弃前面的括号,这样,代码:
pr_debug("success")
会被扩展为:
printk("success")
而不是:
printk("success",)
6、标号元素
标C中要求数组或结构体的初始化值必须以固定的顺序出现,在GNU C中,通过指定索引或结构体成员名,允许初始化值以任意顺序出现。
指定数组索引的方法是在初始化值前添加“[INDEX]”,当然也可以用“[FIRST...LAST]=”形式指定一个范围。例如定义一个数组,将其所有元素初始化为0:
unsigned char data[MAX] = {[0...MAX-1]=0};
而结构体的初始化:
{
.llseek = generic_file_llseek;
};
7、当前函数名
GNU C预定义了两个标示符保存当前函数的名字,__FUNCTION__保存函数在源码中的名字,__PRETTY_FUNCTION__保存带语言特色的名字。在C中,这两个名字是相同的。即只是字符串;
8、特殊属性声明
GNU C允许声明函数、变量和类型的特殊属性,以便进行手工的代码优化和定制代码检查的方法。指定一个声明的属性,只需要在申明后添加 __attribute__((ATTRIBUTE))
其中ATTRIBUTE为属性说明,如果存在多个属性,则以逗号分隔。GNU C支持noreturn format section aligned packed等十多个属性
* noreturn属性作用于函数,表示该函数从不返回。这会让编译器优化代码,并消除不必要的的警告信息。例如
#define ATTRIB_NORET __attribute__ ((noreturn)) ....
asmlinkage NORET_TYPE void do_exit(long error_code) ATTRIB_NORET;
*format属性也可用于函数,表示该函数printf scanf 或strftime风格的参数,指定format属性可以让编译器根据格式串检查参数类型。例如:
asmlinkage int printk(const char * fmt,...)\
__attribute__((format(printf,1,2)));
*unused属性作用于函数和变量,表示该函数或变量可能不会被用到,避免编译器产生的警告信息。
*packed属性作用于变量和类型,表示压缩结构体,使用最小的内存。
struct examprl_struct
{
char a;
int b;
long c;
}__attribute__((packed));
注意,这个__attribute__((packed))只能用在GNU C;
*section ("section-name")
属性 section 用于函数和变量,通常编译器将函数放在 .text 节,变量放在.data 或 .bss 节,使用 section 属性,可以让编译器将函数或变量放在指定的节中。例如:
++++ include/linux/init.h
78: #define __init __attribute__ ((__section__ (".text.init")))
79: #define __exit __attribute__ ((unused, __section__(".text.exit")))
80: #define __initdata __attribute__ ((__section__ (".data.init")))
81: #define __exitdata __attribute__ ((unused, __section__ (".data.exit")))
82: #define __initsetup __attribute__ ((unused,__section__ (".setup.init")))
83: #define __init_call __attribute__ ((unused,__section__ (".initcall.init")))
84: #define __exit_call __attribute__ ((unused,__section__ (".exitcall.exit")))
连接器可以把相同节的代码或数据安排在一起,Linux 内核很喜欢使用这种技术,例如系统的初始化代码被安排在单独的一个节,在初始化结束后就可以释放这部分内存。
* aligned (ALIGNMENT)
属性 aligned 用于变量、结构或联合类型,指定变量、结构域、结构或联合的对齐量,以字节为单位,例如:
++++ include/asm-i386/processor.h
294: struct i387_fxsave_struct {
295: unsigned short cwd;
296: unsigned short swd;
297: unsigned short twd;
298: unsigned short fop;
299: long fip;
300: long fcs;
301: long foo;
......
308: } __attribute__ ((aligned (16)));
表示该结构类型的变量以 16 字节对齐。通常编译器会选择合适的对齐量,显示指定对齐通常是由于体系限制、优化等原因。
* packed
属性 packed 用于变量和类型,用于变量或结构域时表示使用最小可能的对齐,用于枚举、结构或联合类型时表示该类型使用最小的内存。例如:
++++ include/asm-i386/desc.h
51: struct Xgt_desc_struct {
52: unsigned short size;
53: unsigned long address __attribute__((packed));
54: };
域 address 将紧接着 size 分配。属性 packed 的用途大多是定义硬件相关的结
构,使元素之间没有因对齐而造成的空洞。
9、内建函数
GNU C提供了大量的内建函数,其中大部分是标C库函数的GNU C编译器的内建版本。
不属于库函数的其它内建函数的命名通常以__builtin开始;如下所示:
__builtin_return_address(LEVEL);