((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))-fewang-ChinaUnix博客

一、问题的提出
两年之前我写过一篇可变参数学习笔记，里面曾经简单的解释过一句：
代码
((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))
的作用是在考虑字节对齐的因素下计算第一个可变参数的起始地址。
当时限于时间和水平，未能做更详细的解释。
今天(2007-11-26)在csdn论坛上看到了一个帖子

问题：CRT源码分析中一个关于可变函数参数的问题
提问者:Sun_Moon_Stars
里面又问到了这个宏，于是决定抽出半天时间，把这个问题详细的说清楚。也算是把我的那篇文章
做一个完美的结尾。

二、引子
先看一个日常生活中的问题，
问题1:假设有要把一批货物放到集装箱里，货物有12件，
一个箱子最多能装6件货物，求箱子的数目。
解答：显然我们需要12/6=2个箱子，并且每个箱子都是满的。这个连小学生都会算:-)

问题2: 把问题1的条件改一下，假设一个箱子最多能装5件货物，那么现在的箱子数是多少？
解答: 12/5=2.4个，但是根据实际情况，箱子的个数必须为整数，（有不知道这个常识的就不要再往下看了，
回小学重读吧，呵呵）自然我们就要取3，
下面把问题一般化

三、一般数学模型
问题3:设一个箱子最多可以装M件货物，且现有N件货物，
则至少需要多少个箱子，给出一般的计算公式。
这里要注意两点
1、箱子的总数必须为整数
2、N不一定大于M，很显然，即使N

四、通项公式
1、预备知识
在讨论之问题3的解答之前，我们先明确一下/运算符的含义。
定义/运算为取整运算，即
对任意两个整数N,M，必然有且只有唯一的整数X，满足
X*M <= N < (X+1)*M，那么记N/M=X。
这个也正是c里/运算的确切含义。x的存在性和唯一性的严格证明可以见数论教材。
以后如无额外说明,/运算的含义均和本处一致。

/运算有一个基本的性质
若N=MX+Y，则N/M=X+Y/M，证明略

注意：N不是可以随便拆的，设N=A+B，那么一般情况下N/M 不一定等于 A/M+B/M，
如果A和B至少有一个是M的倍数，才能保证式子一定成立。

2、分步讨论
根据上面的/运算符的定义，我们可以得到问题三的解答，分情况讨论一下
已知N/M=X，那么当
(1)、当N正好是M的倍数时即N=M*X时，那么箱子数就是X=N/M
(2)、如果N不是M的倍数，即N=M*X+Y(1 <=Y 那么显然还要多一个箱子来装余下的Y件货物，
则箱子总数为X+1 = N/M+1

3、一般公式
上面的解答虽然完整，但是用起来并不方便，因为每次都要去判断N和M的倍数关系，
我们自然就要想一个统一的公式，于是，下面的公式出现了
箱子数目为 (N+M-1)/M

这个式子用具体数字去验证是很简单的，留给读者去做。
我这里给一个完整的数学推导:
现在已经假定 /运算的结果为取整（或者说取模），即
N/M=X，则XM <=N <(X+1)M
那么，
(1)、当N=MX时，(N+M-1)/M= MX/M+(M-1)/M=X
(2)、当N=MX+Y(1 <=Y 由1 <=Y < M,同时加上M-1，得到M <= Y-1+M <= 2M-1 <2M
根据 /运算的定义 (Y-1+M) /M = 1

所以　(N+M-1)/M = (MX+Y+M-1)/M= MX/M+(Y+M-1)/M= X+1
显然公式 (N+M-1)/M与2中的分步讨论结果一致。
可能有的读者还会问，这个公式是怎么想出来的，怎么就想到了加上那个M-1?
这个问题可以先去看看数论中的余数理论。

五、对齐代码的分析
有了上面的数学基础，我们再来看看开头所说的对齐代码的含义
((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))
意义就很明显了
这里。机器字长度sizeof(int)相当于箱子的容量M,变量的真实字节大小相于
货物总数N，整个代码就是求n所占的机器字数目。

顺便仔细的解释一下
~(sizeof(int)-1))

这里用到了一个位运算的技巧，即若M是2的幂，M=power(2,Y);

则N/M = N>>Y ，

另根据数论中的余数定理，

有N=M*X+Z(1 < =Z < M)
而注意到这里的N,M,Z都是二进制表示，所以把N的最右边的Y位数字就是余数Z.
剩下的左边数字就是模X.

而内存对齐要计算的是占用的总字节数（相当于箱子的最大容量），所以

总字节数 = ( N/M)*M =( N>>Y)<

注意，这里的右移和左移运算并未相互抵消，最后的结果实际上是把N中的余数Z去掉（被清0），

而左边模X得以保持不变。

而当M = power(2,Y) 时

(N >>Y) << Y = (N &(~(M-1))也是一个恒等式（这个读者也可以用数字验证），

所以，就得到我们前面看到的宏

((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))

注意：
(1)这里最关键的一点就是M必须是2的幂（有人常常理解成2的倍数也可以，那是不对的），
否则上面的结论是不成立的
(2) ~(M-1)更专业的叫法就是掩码(mask)。因为数字和这个掩码进行与运算后，数字的最右边Y位的
数字被置0（"掩抹"掉了）.即掩码最右边的0有多少位，数字最右边就有多少位被清0。

小结:
1、字节对齐的数学本质就是数论中的取模运算。在计算机上的含义就是求出一个对象占用的机器字数目。
2、在数学上看内存计算的过程就是先右移再左移相同的位数，以得到箱子的最大容量。

3、在c中/运算可以用位运算和掩码来实现以加快速度（省掉了求位数的过程），前提是机器字长度必须为2的幂。

——————————————————

#define _INTSIZEOF(n) ( (sizeof(n) + sizeof(int) – 1) & ~(sizeof(int) – 1)

[此问题的推荐答案]
~是位取反的意思。
_INTSIZEOF(n)整个做的事情就是将n的长度化为int长度的整数倍。
比如n为5，二进制就是101b，int长度为4，二进制为100b，那么n化为int长度的整数倍就应该为8。
~(sizeof(int) – 1) )就应该为~（4-1）=~（00000011b）=11111100b，这样任何数& ~(sizeof(int) – 1) )后最后两位肯定为0，就肯定是4的整数倍了。
(sizeof(n) + sizeof(int) – 1）就是将大于4m但小于等于4（m+1）的数提高到大于等于4（m+1）但小于4(m+2)，这样再& ~(sizeof(int) – 1) )后就正好将原长度补齐到4的倍数了。