一、问题的提出
两年之前我写过一篇可变参数学习笔记,里面曾经简单的解释过一句:
代码
((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))
的作用是在考虑字节对齐的因素下计算第一个可变参数的起始地址。
当时限于时间和水平,未能做更详细的解释。
今天(2007-11-26)在csdn论坛上看到了一个帖子
问题:CRT源码分析中一个关于可变函数参数的问题
提问者:Sun_Moon_Stars
里面又问到了这个宏,于是决定抽出半天时间,把这个问题详细的说清楚。也算是把我的那篇文章
做一个完美的结尾。
二、引子
先看一个日常生活中的问题,
问题1:假设有要把一批货物放到集装箱里,货物有12件,
一个箱子最多能装6件货物,求箱子的数目。
解答:显然我们需要12/6=2个箱子,并且每个箱子都是满的。这个连小学生都会算:-)
问题2: 把问题1的条件改一下,假设一个箱子最多能装5件货物,那么现在的箱子数是多少?
解答: 12/5=2.4个,但是根据实际情况,箱子的个数必须为整数,(有不知道这个常识的就不要再往下看了,
回小学重读吧,呵呵)自然我们就要取3,
下面把问题一般化
三、一般数学模型 四、通项公式 /运算有一个基本的性质 注意:N不是可以随便拆的,设N=A+B,那么一般情况下N/M 不一定等于 A/M+B/M, 2、分步讨论 3、一般公式 这个式子用具体数字去验证是很简单的,留给读者去做。 所以 (N+M-1)/M = (MX+Y+M-1)/M= MX/M+(Y+M-1)/M= X+1 五、对齐代码的分析 顺便仔细的解释一下 这里用到了一个位运算的技巧,即若M是2的幂,M=power(2,Y); 则N/M = N>>Y , 另根据数论中的余数定理, 有N=M*X+Z(1 < =Z < M) 而内存对齐要计算的是占用的总字节数(相当于箱子的最大容量),所以 总字节数 = ( N/M)*M =( N>>Y)< 注意,这里的右移和左移运算并未相互抵消,最后的结果实际上是把N中的余数Z去掉(被清0), 而左边模X得以保持不变。 而当M = power(2,Y) 时 (N >>Y) << Y = (N &(~(M-1))也是一个恒等式(这个读者也可以用数字验证), 所以,就得到我们前面看到的宏 ((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1)) 注意: 小结: 3、在c中/运算可以用位运算和掩码来实现以加快速度(省掉了求位数的过程),前提是机器字长度必须为2的幂。 —————————————————— [此问题的推荐答案]
问题3:设一个箱子最多可以装M件货物,且现有N件货物,
则至少需要多少个箱子,给出一般的计算公式。
这里要注意两点
1、箱子的总数必须为整数
2、N不一定大于M,很显然,即使N
1、预备知识
在讨论之问题3的解答之前,我们先明确一下/运算符的含义。
定义/运算为取整运算,即
对任意两个整数N,M,必然有且只有唯一的整数X,满足
X*M <= N < (X+1)*M,那么记N/M=X。
这个也正是c里/运算的确切含义。x的存在性和唯一性的严格证明可以见数论教材。
以后如无额外说明,/运算的含义均和本处一致。
若N=MX+Y,则N/M=X+Y/M,证明略
如果A和B至少有一个是M的倍数,才能保证式子一定成立。
根据上面的/运算符的定义,我们可以得到问题三的解答,分情况讨论一下
已知N/M=X,那么当
(1)、当N正好是M的倍数时即N=M*X时,那么箱子数就是X=N/M
(2)、如果N不是M的倍数,即N=M*X+Y(1 <=Y
则箱子总数为X+1 = N/M+1
上面的解答虽然完整,但是用起来并不方便,因为每次都要去判断N和M的倍数关系,
我们自然就要想一个统一的公式,于是,下面的公式出现了
箱子数目为 (N+M-1)/M
我这里给一个完整的数学推导:
现在已经假定 /运算的结果为取整(或者说取模),即
N/M=X,则XM <=N <(X+1)M
那么,
(1)、当N=MX时,(N+M-1)/M= MX/M+(M-1)/M=X
(2)、当N=MX+Y(1 <=Y
根据 /运算的定义 (Y-1+M) /M = 1
显然 公式 (N+M-1)/M与2中的分步讨论结果一致。
可能有的读者还会问,这个公式是怎么想出来的,怎么就想到了加上那个M-1?
这个问题可以先去看看数论中的余数理论。
有了上面的数学基础,我们再来看看开头所说的对齐代码的含义
((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))
意义就很明显了
这里。机器字长度sizeof(int)相当于箱子的容量M,变量的真实字节大小相于
货物总数N,整个代码就是求n所占的机器字数目。
~(sizeof(int)-1))
而注意到这里的N,M,Z都是二进制表示,所以把N的最右边的Y位数字就是余数Z.
剩下的左边数字就是模X.
(1)这里最关键的一点就是M必须是2的幂(有人常常理解成2的倍数也可以,那是不对的),
否则上面的结论是不成立的
(2) ~(M-1)更专业的叫法就是掩码(mask)。因为数字和这个掩码进行与运算后,数字的最右边Y位的
数字被置0("掩抹"掉了).即掩码最右边的0有多少位,数字最右边就有多少位被清0。
1、字节对齐的数学本质就是数论中的取模运算。在计算机上的含义就是求出一个对象占用的机器字数目。
2、在数学上看内存计算的过程就是先右移再左移相同的位数,以得到箱子的最大容量。
~是位取反的意思。
_INTSIZEOF(n)整个做的事情就是将n的长度化为int长度的整数倍。
比如n为5,二进制就是101b,int长度为4,二进制为100b,那么n化为int长度的整数倍就应该为8。
~(sizeof(int) – 1) )就应该为~(4-1)=~(00000011b)=11111100b,这样任何数& ~(sizeof(int) – 1) )后最后两位肯定为0,就肯定是4的整数倍了。
(sizeof(n) + sizeof(int) – 1)就是将大于4m但小于等于4(m+1)的数提高到大于等于4(m+1)但小于4(m+2),这样再& ~(sizeof(int) – 1) )后就正好将原长度补齐到4的倍数了。