Chinaunix首页 | 论坛 | 博客
  • 博客访问: 117845
  • 博文数量: 19
  • 博客积分: 396
  • 博客等级: 一等列兵
  • 技术积分: 156
  • 用 户 组: 普通用户
  • 注册时间: 2010-11-29 09:11
文章分类

全部博文(19)

文章存档

2012年(3)

2011年(16)

分类: C/C++

2011-11-05 12:19:20

((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))

一、问题的提出
两年之前我写过一篇可变参数学习笔记,里面曾经简单的解释过一句:
代码
((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))
的作用是在考虑字节对齐的因素下计算第一个可变参数的起始地址。
当时限于时间和水平,未能做更详细的解释。
今天(2007-11-26)在csdn论坛上看到了一个帖子

问题:CRT源码分析中一个关于可变函数参数的问题
提问者:Sun_Moon_Stars
里面又问到了这个宏,于是决定抽出半天时间,把这个问题详细的说清楚。也算是把我的那篇文章
做一个完美的结尾。

二、引子
先看一个日常生活中的问题,
问题1:假设有要把一批货物放到集装箱里,货物有12件,
一个箱子最多能装6件货物,求箱子的数目。
解答:显然我们需要12/6=2个箱子,并且每个箱子都是满的。这个连小学生都会算:-)

问题2:       把问题1的条件改一下,假设一个箱子最多能装5件货物,那么现在的箱子数是多少?
解答:       12/5=2.4个,但是根据实际情况,箱子的个数必须为整数,(有不知道这个常识的就不要再往下看了,
回小学重读吧,呵呵)自然我们就要取3,
下面把问题一般化

三、一般数学模型
问题3:设一个箱子最多可以装M件货物,且现有N件货物,
则至少需要多少个箱子,给出一般的计算公式。
这里要注意两点
1、箱子的总数必须为整数
2、N不一定大于M,很显然,即使N

四、通项公式
1、预备知识
在讨论之问题3的解答之前,我们先明确一下/运算符的含义。
定义/运算为取整运算,即
对任意两个整数N,M,必然有且只有唯一的整数X,满足
X*M   <=   N   <   (X+1)*M,那么记N/M=X。
这个也正是c里/运算的确切含义。x的存在性和唯一性的严格证明可以见数论教材。
以后如无额外说明,/运算的含义均和本处一致。

/运算有一个基本的性质
若N=MX+Y,则N/M=X+Y/M,证明略

注意:N不是可以随便拆的,设N=A+B,那么一般情况下N/M   不一定等于   A/M+B/M,
如果A和B至少有一个是M的倍数,才能保证式子一定成立。

2、分步讨论
根据上面的/运算符的定义,我们可以得到问题三的解答,分情况讨论一下
已知N/M=X,那么当
(1)、当N正好是M的倍数时即N=M*X时,那么箱子数就是X=N/M
(2)、如果N不是M的倍数,即N=M*X+Y(1 <=Y 那么显然还要多一个箱子来装余下的Y件货物,
则箱子总数为X+1   =   N/M+1

3、一般公式
上面的解答虽然完整,但是用起来并不方便,因为每次都要去判断N和M的倍数关系,
我们自然就要想一个统一的公式,于是,下面的公式出现了
箱子数目为     (N+M-1)/M

这个式子用具体数字去验证是很简单的,留给读者去做。
我这里给一个完整的数学推导:
现在已经假定   /运算的结果为取整(或者说取模),即
N/M=X,则XM   <=N   <(X+1)M
那么,
(1)、当N=MX时,(N+M-1)/M=   MX/M+(M-1)/M=X
(2)、当N=MX+Y(1 <=Y 由1 <=Y   <   M,同时加上M-1,得到M   <=   Y-1+M   <=   2M-1   <2M
根据   /运算的定义   (Y-1+M)   /M   =   1

所以 (N+M-1)/M   =   (MX+Y+M-1)/M=   MX/M+(Y+M-1)/M=   X+1
显然   公式   (N+M-1)/M与2中的分步讨论结果一致。
可能有的读者还会问,这个公式是怎么想出来的,怎么就想到了加上那个M-1?
这个问题可以先去看看数论中的余数理论。

五、对齐代码的分析
有了上面的数学基础,我们再来看看开头所说的对齐代码的含义
((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))
意义就很明显了
这里。机器字长度sizeof(int)相当于箱子的容量M,变量的真实字节大小相于
货物总数N,整个代码就是求n所占的机器字数目。

顺便仔细的解释一下
~(sizeof(int)-1))

这里用到了一个位运算的技巧,即若M是2的幂,M=power(2,Y);

则N/M   =  N>>Y  ,

另根据数论中的余数定理,

有N=M*X+Z(1 <   =Z <  M)
而注意到这里的N,M,Z都是二进制表示,所以把N的最右边的Y位数字就是余数Z.
剩下的左边数字就是模X.

而内存对齐要计算的是占用的总字节数(相当于箱子的最大容量),所以

总字节数 = ( N/M)*M =( N>>Y)<

注意,这里的右移和左移运算并未相互抵消,最后的结果实际上是把N中的余数Z去掉(被清0),

而左边模X得以保持不变。

而当M = power(2,Y) 时

(N >>Y) << Y = (N   &(~(M-1))也是一个恒等式(这个读者也可以用数字验证),

所以,就得到我们前面看到的宏

((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))

注意:
(1)这里最关键的一点就是M必须是2的幂(有人常常理解成2的倍数也可以,那是不对的),
否则上面的结论是不成立的
(2)   ~(M-1)更专业的叫法就是掩码(mask)。因为数字和这个掩码进行与运算后,数字的最右边Y位的
数字被置0("掩抹"掉了).即掩码最右边的0有多少位,数字最右边就有多少位被清0。

小结:
1、字节对齐的数学本质就是数论中的取模运算。在计算机上的含义就是求出一个对象占用的机器字数目。
2、在数学上看内存计算的过程就是先右移再左移相同的位数,以得到箱子的最大容量。

3、在c中/运算可以用位运算和掩码来实现以加快速度(省掉了求位数的过程),前提是机器字长度必须为2的幂。

——————————————————

#define _INTSIZEOF(n) ( (sizeof(n) + sizeof(int) – 1) & ~(sizeof(int) – 1)

[此问题的推荐答案]
~是位取反的意思。
_INTSIZEOF(n)整个做的事情就是将n的长度化为int长度的整数倍。
比如n为5,二进制就是101b,int长度为4,二进制为100b,那么n化为int长度的整数倍就应该为8。
~(sizeof(int) – 1) )就应该为~(4-1)=~(00000011b)=11111100b,这样任何数& ~(sizeof(int) – 1) )后最后两位肯定为0,就肯定是4的整数倍了。
(sizeof(n) + sizeof(int) – 1)就是将大于4m但小于等于4(m+1)的数提高到大于等于4(m+1)但小于4(m+2),这样再& ~(sizeof(int) – 1) )后就正好将原长度补齐到4的倍数了。

阅读(2800) | 评论(0) | 转发(1) |
给主人留下些什么吧!~~