简明深入地理解“内存对齐”问题-zhanglin496-ChinaUnix博客

mxl&nbsp;ChinaUnix博客zhanglin.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

zhanglin496

博客访问： 1029242
博文数量： 442
博客积分： 1146
博客等级：少尉
技术积分： 1604
用户组：普通用户
注册时间： 2010-11-04 12:52

个人简介

123

文章分类

全部博文（442）

RCU机制（2）
tc流量控制（2）
ipv6（1）
内核启动流程（5）
openwrt（7）
bootloader（3）
http（1）
C++（3）
网络概念（0）
多线程编程（2）
常用算法（14）
linux操作（9）
内核同步（26）

内存屏障（5）
linux内核（191）

RCU机制（3）

netfilter-nat分（3）

skb解析（5）

定时器实现（1）

poll分析（4）

proc系统（5）

linux-IPC（13）

netfilter（84）

linux数据结构（17）

linux驱动（11）
git（3）
linux配置（7）
个人经验总结（6）
调试（7）
Unix C（40）
TCP/IP（26）
未分配的博文（87）

文章存档

2017年（3）

2016年（15）

2015年（132）

2014年（52）

2013年（101）

2012年（110）

2011年（29）

我的朋友

相关博文

简明深入地理解“内存对齐”问题

分类：嵌入式

2013-05-30 17:19:54

原文地址：简明深入地理解“内存对齐”问题作者：小熊慢跑

问题一：为什么32位CPU只能读取字长（4字节）倍数的地址
答：因为32位计算机的存储系统通常使用4组存储体，存储一个字长（4字节）数据时采用分体存储方式，即4个存储体各存储1个字节，且低二位（A0和 A1）地址线未用作选址，因而CPU在寻址时只能寻到以字长（4字节）为倍数的地址。同理，16位计算机系统普遍采用两组存储体（奇/偶）分体存储数据，且低一位（A0）地址线未用作选址，从而导致基于这种设计的CPU只能寻到以2为倍数的地址。

问题二：什么是“自然对齐”？
答：如果一个数据的地址是它类型长度的整数被，那么这个数据就是“自然对齐”的。

问题三：为什么如果多字节型数据不对齐会浪费额外的CPU时钟？
答：以32位系统为例，假设一个int型数据的地址是0x0004，由于它是对齐的，即CPU可以寻到0x0004这个地址，所以CPU可以一次性将 0x0004 - 0x0007这4个字节的数据取出或存入，但如果它的地址是0x0001，由于CPU在它附近只能寻到0x0000和0x0004这两个地址，所以需要分别从这两个地址取出数据后拼接得到目标数据。

问题四：为什么定义结构体时，要在末尾用空字节将该结构体长度填充至“长度最大的成员”的长度的整数倍？
答：在接连定义多个结构体对象（或定义结构体数组）时，如果结构体没有自然对齐的话，会导致后续很多结构体内多字节型成员的地址不能满足“自然对齐”，下面举两个例子对比说明。
例一：
struct
{
    long k;        //4字节
    char a[5];    //1字节 * 5 = 5字节
    char pad[3];//1字节 * 3 = 3字节
}                        //该结构体长度为12字节，满足最长成员类型(long)长度(4字节)的整数倍
   假设定义一个拥有2个元素的结构体数组，且首成员long的偏移为0，那么这两个元素内成员的偏移为：
    元素1_long: 0
    元素1_a: 4
    元素1_pad: 9
    元素2_long: 12
    元素2_a: 16
    元素2_pad: 21
    *元素3_long: 24
   由此可见，结构体自然对齐时，定义多个结构体时各自成员必将自然对齐，下面再看一个例子。

例二：
struct
{
    long k;        //4字节
    char a[5];    //1字节 * 5 = 5字节
}                        //该结构体长度为9字节，不满足最长成员类型(long)长度(4字节)的整数倍
  同样假设定义一个拥有2个元素的结构体数组，且首成员long的偏移为0，那么这两个元素内成员的偏移为：
    元素1_long: 0
    元素1_a: 4
    元素2_long: 9    //未自然对齐
    元素2_a: 13

   在这个例子里，结构体的长度没有被填充至long型长度的整数倍，这导致了结构体数组中第2个元素中的long型成员不满足自然对齐条件（即第2个数组元素没有自然对齐），这里元素2_long的内容存放在 0x0009 - 0x000c这4个字节的空间内，但CPU在它附近只能寻址0x0008、0x000c这两个地址，其对应的字长空间分别为0x0008 - 0x000b和0x000c - 0x000f，这就需要分别从0x0008和0x000c两个地址取数据后拼接得到0x0009处的long型数据。
   这就是对结构体型之所以那样补足长度的原因了。

问题四：如果结构体含double型成员，是对该结构体长度填充至字长倍数还是双字长倍数？
答：我个人认为对x86系列CPU来说，填充至字长倍数即可（32位的话对应是4字节对齐），且gcc在这种情况下是这样默认的。至于网上说按8字节对齐的资料，观察后发现它们都交代了诸如“比如这么一种处理器，它每次读写内存的时候都从某个8倍数的地址开始”这样的前提。所以个人推测“将长度填充至长度最大的成员的长度的倍数”这条规则是充分考虑跨平台移植性而定下的，在x86系列平台最长按字长的倍数对结构体类型进行填充即可。

后记：
不得不承认，对于第四个问题我还是心存疑惑，真心希望能得到大家的指教。

阅读(884) | 评论(0) | 转发(0) |

上一篇：关于ptype_all和pypte_base中的pt_prev的说明[转]

下一篇：[原创]Linux Kernel中断下半部分析_softirq

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6