全部博文(413)
分类: C/C++
2011-08-02 14:22:01
可能有不少读者会问,字节对齐有必要拿出来单独写一篇博客嘛?我觉得是很有必要,但是它却是被很多人所忽视的一个重点。那么我们使用字节对齐的作用 和原因是什么呢?由于硬件平台之间对存储空间的处理上是有很大不同的,一些平台对某些特定类型的数据只能从某些特定地址开始存取,如通常有些架构的CPU 要求在编程时必须保证字节对齐,否则访问一个没有进行字节对齐的变量的时候会发生错误。而有些平台可能没有这种情况,但是通常的情况是如果我们编程的时候 不按照适合其平台要求对数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始,如我们操作一个int型数据,如果存放在偶地址 开始的地方,那么一个读周期就可以读出,而如果存放在奇地址开始的地方,就可能会需要2个读周期,两个周期读取出来的字节我们还要对它们进行高低字节的拼 凑才能得到该int型数据,从而使得我们的读取效率较低,这也从侧面反映出了一个问题,就是我们很多时候是在牺牲空间来节省时间的。
可能看 了上面的讲解你还是不太明白,那我们再来看一次什么是字节对齐呢? 我们现在的计算机中内存空间都是按照字节来进行划分的,从理论上来讲的话似乎对任何类 型的变量的访问可以从任何地址开始,然而值得注意的就是,实际情况下在访问特定变量的时候经常在特定的内存地址访问,从而就需要各种类型的数据按照一定的 规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐。
按照预先的计划安排,这次应该是写《C语言的那些小秘密之链表(三)》的, 但是我发现如果直接开始讲解linux内核链表的话,可能有些地方如果我们不在此做一个适当的讲解的话,有的读者看起来可能难以理解,所以就把字节对齐挑 出来另写一篇博客,我在此尽可能的讲解完关于字节对齐的内容,希望我的讲解对你有所帮助。
在此之前我们不得不提的一个操作符就是sizeof,其作用就是返回一个对象或者类型所占的内存字节数。我们为什么不在此称之为sizeof()函数呢?看看下面一段代码:
这段代码在linux环境下我采用gcc编译是没有任何问题的,对于void类型,其长度为1,但是如果我们在vc6下面运行的话话就会出现 illegal sizeof operand错误,所以我们称之为操作符更加的准确些,既然是操作符,那么我们来看看它的几种使用方式:
1、sizeof( object ); // sizeof( 对象 );
2、 sizeof( type_name ); // sizeof( 类型 );
3、sizeof object; // sizeof 对象; 通常这种写法我们在代码中都不会使用,所以很少见到。
下面来看段代码加深下印象:
从运行结果我们可以看出上面的几种使用方式,实际上,sizeof计算对象的大小也是转换成对对象类型的计算,也就是说,同种类型的不同对象其 sizeof值都是一样的。从给出的代码中我们也可以看出sizeof可以对一个表达式求值,编译器根据表达式的最终结果类型来确定大小,但是一般不会对 表达式进行计算或者当表达式为函数时并不执行函数体。如:
sizeof(print()): 4
从结果我们可以看出print()函数并没有被调用。
接下来我们来看看linux内核链表里的一个宏:
#define offsetof(TYPE, MEMBER) ((size_t) &((TYPE *)0)->MEMBER)
对这个宏的讲解我们大致可以分为以下4步进行讲解:
1、( (TYPE *)0 ) 0地址强制 "转换" 为 TYPE结构类型的指针;
2、((TYPE *)0)->MEMBER 访问TYPE结构中的MEMBER数据成员;
3、&( ( (TYPE *)0 )->MEMBER)取出TYPE结构中的数据成员MEMBER的地址;
4、(size_t)(&(((TYPE*)0)->MEMBER))结果转换为size_t类型。
宏 offsetof的巧妙之处在于将0地址强制转换为 TYPE结构类型的指针,TYPE结构以内存空间首地址0作为起始地址,则成员地址自然为偏移地址。 可能有的读者会想是不是非要用0呢?当然不是,我们仅仅是为了计算的简便。也可以使用是他的值,只是算出来的结果还要再减去该数值才是偏移地址。来看看下 面的代码:
运行结果为:
为了让读者加深印象,我们这里在代码中没有使用0,而是使用的4,所以在最终计算出的结果部分减去了一个4才是偏移地址,当然实际使用中我们都是用的是0。
懂了上面的宏offsetof之后我们再来看看下面的代码:
运行结果为:
对于字节对齐不了解的读者可能有疑惑的是c的偏移量怎么会是8和结构体的大小怎么会是12呢?因该是 sizeof(int)+sizeof(char)+sizeof(int)=9。其实这是编译器对变量存储的一个特殊处理。为了提高CPU的存储速度, 编译器对一些变量的起始地址做了对齐处理。在默认情况下,编译器规定各成员变量存放的起始地址相对于结构的起始地址的偏移量必须为该变量的类型所占用的字 节数的倍数。现在来分析下上面的代码,如果我们假定a的起始地址为0,它占用了4个字节,那么接下来的空闲地址就是4,是1的倍数,满足要求,所以b存放 的起始地址是4,占用一个字节。接下来的空闲地址为5,而c是int变量,占用4个字节,5不是4的整数倍,所以向后移动,找到离5最近的8作为存放c的 起始地址,c也占用4字节,所以最后使得结构体的大小为12。现在我们再来看看下面的代码:
运行结果为:
分析下上面我们的运行结果,重点是struct stu3和struct stu4,在struct stu3中使用的是一个字节对齐,因为在stu1和stu3中都只有一个char类型,在struct stu3中我们定义了一个stu1类型的 s,而stu1所占的大小为7,所以加上加上接下来的一个字节str,sizeof(stu3)为8。在stu4中,由于我们定义了一个stu2类型的 s,而s是一个double类型的变量,占用8字节,所以接下来在stu4中采用的是8字节对齐。如果我们此时假定stu4中的s从地址0开始存放,占用 8个字节,接下来的空闲地址就是8,根据我们上面的讲解可知刚好可以在此存放str。所以变量都分配完空间后stu4结构体所占的字节数为9,但9不是结 构体的边界数,也就是说我们要求分配的字节数为结构体中占用空间最大的类型所占用的字节数的整数倍,在这里也就是double类型所占用的字节数8的整数 倍,所以接下来还要再分配7个字节的空间,该7个字节的空间没有使用,由编译器自动填充,没有存放任何有意义的东西。
当然我们也可以使用预编译指令#pragma pack (value)来告诉编译器,使用我们指定的对齐值来取代缺省的。接下来我们来看看一段代码。
现在来分析下上面的代码。由于之前我们一直都在使用struct,所以在这里我们特地例举了一个union的代码来分析下,我们大家都知道union的大 小取决于它所有的成员中占用空间最大的一个成员的大小。由于在union stu1中我们使用了1字节对齐,所以对于stu1来说占用空间最大的是char str[10]类型的数组,,其值为10。为什么stu1为10而stu2却是12呢?因为在stu2的上面我们使用了#pragma pack () ,取消指定对齐,恢复缺省对齐。所以由于stu2其中int类型成员的存在,使stu2的对齐方式变成4字节对齐,也就是说,stu2的大小必须在4的对 界上,换句话说就是stu2的大小要是4的整数倍,所以占用的空间变成了12。
到这儿本篇博客的内容就算是讲解完了,由于本人水平有限,博客中的不妥或错误之处在所难免,殷切希望读者批评指正。同时也欢迎读者共同探讨相关的内容,如果乐意交流的话请留下你宝贵的意见。