关于内存对齐方式-caojiangfeng-ChinaUnix博客

珠一

首页　| 　博文目录　| 　关于我

caojiangfeng

博客访问： 1334886
博文数量： 213
博客积分： 7590
博客等级：少将
技术积分： 2185
用户组：普通用户
注册时间： 2008-08-31 17:31

个人简介

热爱开源，热爱linux

文章分类

全部博文（213）

大数据（3）

hadoop（3）
Python（1）
安全（0）
科技（2）
数据库（6）
QT（3）
笔试面试题（4）
常识（10）
LAMP（3）
操作系统（0）
Csharp（1）
perl（13）

perl脚本（4）
java（11）

jvm调优工具（1）
网络学习（5）

网络编程（1）
C语言（24）

用法与技术（10）

程序（12）
电脑知识（2）
linux相关（122）

日志相关（1）

sed和awk（9）

循环（1）

有用的shell网址（0）

驱动开发（4）

我的shell脚本（9）

shell（12）

应用配置（11）

模块编程（10）

Kernel（8）

条件语句（2）

其他（6）

命令学习（20）

信号及其信号处理（3）

进程（7）

文件系统（1）

系统配置（12）
英语学习（2）
未分配的博文（1）

文章存档

2018年（4）

2017年（1）

2015年（1）

2014年（5）

2013年（2）

2012年（2）

2011年（21）

2010年（82）

2009年（72）

2008年（23）

我的朋友

今天看到小组上有人问关于内存对齐的相关问题，我一直都没有搞懂这方面的内容，今天索性好好查查资料，现在终于高明白了，我所参阅资料中觉得比较好的两篇博客，于是转了过来，以后还可以从方便参考

也谈内存对齐 - [技术前沿]

Tag：语言探索

：转载时请以超链接形式标明文章原始出处和作者信息及本声明
 http://bigwhite.blogbus.com/logs/1347304.html

在最近的项目中，我们涉及到了“内存对齐”技术。对于大部分程序员来说，“内存对齐”对他们来说都应该是“透明的”。“内存对齐”应该是编译器的“管辖范围”。编译器为程序中的每个“数据单元”安排在适当的位置上。但是C语言的一个特点就是太灵活，太强大，它允许你干预“内存对齐”。如果你想了解更加底层的秘密，“内存对齐”对你就不应该再透明了。

一、内存对齐的原因
大部分的参考资料都是如是说的：
1、平台原因(移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
2、性能原因：数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。

二、对齐规则
每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。程序员可以通过预编译命令#pragma pack(n)，n=1,2,4,8,16来改变这一系数，其中的n就是你要指定的“对齐系数”。

规则：
1、数据成员对齐规则：结构(struct)(或联合(union))的数据成员，第一个数据成员放在offset为0的地方，以后每个数据成员的对齐按照#pragma pack指定的数值和这个数据成员自身长度中，比较小的那个进行。
2、结构(或联合)的整体对齐规则：在数据成员完成各自对齐之后，结构(或联合)本身也要进行对齐，对齐将按照#pragma pack指定的数值和结构(或联合)最大数据成员长度中，比较小的那个进行。
3、结合1、2颗推断：当#pragma pack的n值等于或超过所有数据成员长度的时候，这个n值的大小将不产生任何效果。

三、试验
我们通过一系列例子的详细说明来证明这个规则吧!
我试验用的编译器包括GCC 3.4.2和VC6.0的C编译器，平台为Windows XP + Sp2。

我们将用典型的struct对齐来说明。首先我们定义一个struct：
#pragma pack(n) /* n = 1, 2, 4, 8, 16 */
struct test_t {
int a;
char b;
short c;
char d;
};
#pragma pack(n)
首先我们首先确认在试验平台上的各个类型的size，经验证两个编译器的输出均为：
sizeof(char) = 1
sizeof(short) = 2
sizeof(int) = 4

我们的试验过程如下：通过#pragma pack(n)改变“对齐系数”，然后察看sizeof(struct test_t)的值。

1、1字节对齐(#pragma pack(1))
输出结果：sizeof(struct test_t) = 8 [两个编译器输出一致]
分析过程：
1) 成员数据对齐
#pragma pack(1)
struct test_t {
int a;  /* 长度4 < 1 按1对齐；起始offset=0 0%1=0；存放位置区间[0,3] */
char b;  /* 长度1 = 1 按1对齐；起始offset=4 4%1=0；存放位置区间[4] */
short c; /* 长度2 > 1 按1对齐；起始offset=5 5%1=0；存放位置区间[5,6] */
char d;  /* 长度1 = 1 按1对齐；起始offset=7 7%1=0；存放位置区间[7] */
};
#pragma pack()
成员总大小=8

2) 整体对齐
整体对齐系数 = min((max(int,short,char), 1) = 1
整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 8 /* 8%1=0 */ [注1]

2、2字节对齐(#pragma pack(2))
输出结果：sizeof(struct test_t) = 10 [两个编译器输出一致]
分析过程：
1) 成员数据对齐
#pragma pack(2)
struct test_t {
int a;  /* 长度4 > 2 按2对齐；起始offset=0 0%2=0；存放位置区间[0,3] */
char b;  /* 长度1 < 2 按1对齐；起始offset=4 4%1=0；存放位置区间[4] */
short c; /* 长度2 = 2 按2对齐；起始offset=6 6%2=0；存放位置区间[6,7] */
char d;  /* 长度1 < 2 按1对齐；起始offset=8 8%1=0；存放位置区间[8] */
};
#pragma pack()
成员总大小=9

2) 整体对齐
整体对齐系数 = min((max(int,short,char), 2) = 2
整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 10 /* 10%2=0 */

3、4字节对齐(#pragma pack(4))
输出结果：sizeof(struct test_t) = 12 [两个编译器输出一致]
分析过程：
1) 成员数据对齐
#pragma pack(4)
struct test_t {
int a;  /* 长度4 = 4 按4对齐；起始offset=0 0%4=0；存放位置区间[0,3] */
char b;  /* 长度1 < 4 按1对齐；起始offset=4 4%1=0；存放位置区间[4] */
short c; /* 长度2 < 4 按2对齐；起始offset=6 6%2=0；存放位置区间[6,7] */
char d;  /* 长度1 < 4 按1对齐；起始offset=8 8%1=0；存放位置区间[8] */
};
#pragma pack()
成员总大小=9

2) 整体对齐
整体对齐系数 = min((max(int,short,char), 4) = 4
整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 12 /* 12%4=0 */

4、8字节对齐(#pragma pack(8))
输出结果：sizeof(struct test_t) = 12 [两个编译器输出一致]
分析过程：
1) 成员数据对齐
#pragma pack(8)
struct test_t {
int a;  /* 长度4 < 8 按4对齐；起始offset=0 0%4=0；存放位置区间[0,3] */
char b;  /* 长度1 < 8 按1对齐；起始offset=4 4%1=0；存放位置区间[4] */
short c; /* 长度2 < 8 按2对齐；起始offset=6 6%2=0；存放位置区间[6,7] */
char d;  /* 长度1 < 8 按1对齐；起始offset=8 8%1=0；存放位置区间[8] */
};
#pragma pack()
成员总大小=9

2) 整体对齐
整体对齐系数 = min((max(int,short,char), 8) = 4
整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 12 /* 12%4=0 */

5、16字节对齐(#pragma pack(16))
输出结果：sizeof(struct test_t) = 12 [两个编译器输出一致]
分析过程：
1) 成员数据对齐
#pragma pack(16)
struct test_t {
int a;  /* 长度4 < 16 按4对齐；起始offset=0 0%4=0；存放位置区间[0,3] */
char b;  /* 长度1 < 16 按1对齐；起始offset=4 4%1=0；存放位置区间[4] */
short c; /* 长度2 < 16 按2对齐；起始offset=6 6%2=0；存放位置区间[6,7] */
char d;  /* 长度1 < 16 按1对齐；起始offset=8 8%1=0；存放位置区间[8] */
};
#pragma pack()
成员总大小=9

2) 整体对齐
整体对齐系数 = min((max(int,short,char), 16) = 4
整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 12 /* 12%4=0 */

四、结论
8字节和16字节对齐试验证明了“规则”的第3点：“当#pragma pack的n值等于或超过所有数据成员长度的时候，这个n值的大小将不产生任何效果”。另外内存对齐是个很复杂的东西，上面所说的在有些时候也可能不正确。呵呵^_^

[注1]
什么是“圆整”？
举例说明：如上面的8字节对齐中的“整体对齐”，整体大小=9 按 4 圆整 = 12
圆整的过程：从9开始每次加一，看是否能被4整除，这里9，10，11均不能被4整除，到12时可以，则圆整结束。

下面这篇文章也是转来的，让我对double，long类型的数据对其方式有了新的认识，在此感谢作者了

gcc对齐规则（如果有什么错误，请高手指出）：

（unsigned）char使用一字节对齐

int main(){ typedef struct{char a;char b;char c;}node; printf("%d\n",sizeof(node)); return 0; }

上面的代码在linux下将打印 3

任何2字节大小的数据类型(比如short)的对齐模数是2，

int main(){ typedef struct{char a;short b;}node; printf("%d\n",sizeof(node)); return 0; }

上面的代码将打印 4.

而其它所有超过2字节的数据类型(比如long,double)都以4为对齐模数。

int main(){ typedef struct{char a;double b;char c;int d;short e;}node; printf("%d\n",sizeof(node)); return 0; }

上面的代码将打印 24

内存中存储图示为(括号内为占用字节数)

a(1)+填充(3)+b(8)+c(1)+填充(3)+d(4)+e(2)+填充(2)=24

很显然，这里有一个问题。即需要在最后填充字节满足某一个位数的倍数。这个位数就是数值中的最大字节数。上面的代码中结构node包含需要以4字节对齐的double和int类型。，所以short e后面需要填充两一个字节满足4的倍数。

int main(){ typedef struct{char a;double b;char c;int d;short e;}node; typedef struct{char a;node b;short c;}node1; printf("%d\n",sizeof(node1)); return 0; }

上面的代码将打印 32.显然node也是以4字节对齐。

windows下对齐有些差异。大于等于8字节的数据类型使用8字节对齐。

所以上面的代码在windows下执行将输出48.

其中node在内存中的图示为

a(1)+fill(7)+b(8)+c(1)+fill(3)+d(4)+e(2)+fill(6)=32

node1在内存中的图示为

a(1)+fill(7)+b(32)+c(2)+fill(6)=48.

原文地址 http://blog.chinaunix.net/u2/76055/showart_1328044.html

阅读(1131) | 评论(0) | 转发(0) |

上一篇：影响算法的十位大师

下一篇：shell脚本实现自动创建C语言文件

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6