位域-hm2462964492-ChinaUnix博客

hm2462964492的ChinaUnix博客

首页　| 　博文目录　| 　关于我

hm2462964492

博客访问： 205421
博文数量： 81
博客积分： 0
博客等级：民兵
技术积分： 540
用户组：普通用户
注册时间： 2014-05-04 12:48

文章分类

全部博文（81）

未分配的博文（81）

文章存档

2015年（23）

2014年（58）

我的朋友

相关博文

位域

分类： C/C++

2014-12-12 10:20:42

有些信息在存储时，并不需要占用一个完整的字节，而只需占几个或一个二进制位。例如在存放一个开关量时，只有0和1 两种状态，用一位二进位即可。为了节省存储空间，并使处理简便，Ｃ语言提供了一种数据结构，称为“位域”或“位段”。所谓“位域”是把一个类型单元中的二进位划分为几个不同的区域，并说明每个区域的位数。每个域有一个域名，允许在程序中按域名进行操作。这样就可以达到压缩数据的目的。

位域定义

位域定义与结构定义相仿，其形式为：

struct slabel {

位域类型位域名：位域bit长度；

位域类型：位域bit长度；

…

};

在K&R中，规定的位域类型只能是ints——这应该是包括signed和unsigned的char、short和int。而且最好注明是signed还是unsigned类型的。诚然，C99中增加了新的支持类型，不过为了兼容性，还是遵循以前的标准吧。据我所知，也就是Borland、GCC的最新版本才能比较完善地支持C99，而Microsoft似乎并不支持，而且看上去将来也不会打算支持了。顺便发句牢骚，C99出来后C和C++似乎分道扬镳了，不爽啊。希望C++的新标准能让它们贴近点吧。

实际上，我觉得位域可以看作是取值范围缩小了的位域类型：所有对位域类型能做的操作，对位域都能做。如对int型的位域，可以用printf(“%d”,位域名)来输出，也可以用scanf(“%d”,&位域名)来进行输入。

位域的压缩与对齐

位域的内存对齐有其特殊的地方，因为在对齐的过程中不仅穿插着数据的压缩，而且对齐也分为字段对齐和位域类型对齐两种。而这里的位域类型对齐实际上就是一般的数据内存对齐。具体的压缩与对齐规则如下：

1) 压缩：如果相邻位域字段的位域类型相同，各个位域字段只占定义时的bit长度。

struct test1 {

char a : 2;

char b : 3;

char c : 1;

};

其大小为1 bytes，a和b和c在一个char中。

2) 压缩和字段对齐：一个位域字段必须存储在其位域类型的一个单元所占空间中,不能横跨两个该位域类型的单元。也就是说，当某个位域字段正处于两个该位域类型的单元中间时，只使用第二个单元，第一个单元剩余的bit位置补（pad）0。

struct test2 {

char a : 2;

char b : 3;

char c : 7;

};

其大小为2 bytes，a和b在一个char中，c在第二个char中。

3) 位域类型对齐：如果相邻的位域字段的类型不同，在不同的位域类型间，按通用的对齐规则进行不同数据类型间的对齐（注意，struct的长度是其内部最宽类型的整数倍）；同时在相同位域类型的字段间按以上两条规则对齐。

struct test3

{

char a:1;

char :2;

long b:3;

char c:2;

};

其大小为12bytes。

4) 终止压缩：如果位域字段之间穿插着非位域字段，则不进行压缩；

struct test3

{

char a:1;

char :2;

long b;

char c:2;

};

其大小为12bytes，如果注释掉long b，则为1byte。

顺便指出，没有位域名的位域字段是不能使用的，只是用来占位置。

问题和总结

1. 网上有一种说法是位域的长度不能跨字节，这是完全错误的。在压缩与对齐规则的第二条中说明了正确的规定。其实K&R中的原话是“is a set of adjacent bits within a single implementation-defined storage unit that we will call a ``word.''“。首先，word不是字节的意思，而这个word是不是两个字节，我看也不是。这里的word指的应该是同一种位域类型在不同系统中不同的实现长度。正因为如此，作者才用了implementation-defined这个词。以下是证明可以跨字节的例程：

#include

int main()

{

struct foo4 {

char a : 2;

char b : 3;

int c : 18;

};

struct foo4 t;

t.c = 50*1024;

printf("%d",t.c);

int len = sizeof(foo4);

printf("%d",len);

return 0;

}

输出t.c是51200，可以看出c可以取到18bits。

2. 因为在一个byte中，bit位也是有分big-endian和small-endian的，所以位域的移植性并不好。不过在嵌入式中由于有许多特定的设备，在此中可以尽情使用位域。

在本文中，位域类型就是数据类型，呵呵。位域可以看作是取值范围缩小了的位域类型，所有对位域类型能做的操作，对位域都能做。比较难的地方在于位域字段的压缩与对齐。嗯，还有signed和unsigned类型要特别注意。

阅读(1053) | 评论(0) | 转发(0) |

上一篇：ioctl与setsockopt到底有什么区别

下一篇：ubuntu下安装zlib,bzlib

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6