程序设计的内存分配问题-908416047-ChinaUnix博客

MiNoteBooklinuxfans.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

908416047

博客访问： 117076
博文数量： 50
博客积分： 968
博客等级：少尉
技术积分： 492
用户组：普通用户
注册时间： 2011-05-17 09:51

文章分类

全部博文（50）

网络编程（1）
Ubuntu 使用笔记（0）
面试笔试收集（4）
算法(ACM)（2）
环境搭建（4）

Linux（1）

ARM（3）
源码（7）

ASM（0）

QT（0）

C/C++（7）
其他（3）
C/C++（5）
ARM+Linux（11）

H264（1）

V4L2（0）

驱动（0）
Linux（12）
未分配的博文（1）

文章存档

2012年（2）

2011年（48）

我的朋友

tianyalo

相关博文

程序设计的内存分配问题

分类： C/C++

2011-05-18 22:10:49

一、一般C/C++程序占用的内存主要分为5种

1、栈区（stack）：类似于堆栈，由程序自动创建、自动释放。函数参数、局部变量以及返回点等信息都存于其中。

2、堆区（heap）：使用自由，不需预先确定大小。多数情况下需要由程序员手动申请、释放。如不释放，程序结束后由操作系统垃圾回收机制收回。

3、全局区/静态区（static）：全局变量和静态变量的存储是区域。程序结束后由系统释放。

4、文字常量区：常量字符串就是放在这里的。程序结束后由系统释放。

5、程序代码区：既可执行代码。

例：

#include

int quanju;/*全局变量，全局区/静态区（static）*/

void fun(int f_jubu); /*程序代码区*/

int main(void)/**/

{

int m_jubu;/*栈区（stack）*/

static int m_jingtai;/*静态变量，全局区/静态区（static）*/

char *m_zifum,*m_zifuc = "hello";/*指针本身位于栈。指向字符串"hello"，位于文字常量区*/

void (*pfun)(int); /*栈区（stack）*/

pfun=&fun;

m_zifum = (char *)malloc(sizeof(char)*10);/*指针内容指向分配空间，位于堆区（heap）*/

pfun(1);

printf("&quanju : %x\n",&quanju);

printf("&m_jubu : %x\n",&m_jubu);

printf("&m_jingtai: %x\n",&m_jingtai);

printf("m_zifuc : %x\n",m_zifuc);

printf("&m_zifuc : %x\n",&m_zifuc);

printf("m_zifum : %x\n",m_zifum);

printf("&m_zifum : %x\n",&m_zifum);

printf("pfun : %x\n",pfun);

printf("&pfun : %x\n",&pfun);

getch();

return 0;

}

void fun(int f_jubu)

{

static int f_jingtai;

printf("&f_jingtai: %x\n",&f_jingtai);

printf("&f_jubu : %x\n",&f_jubu);/*栈区（stack）,但是与主函数中m_jubu位于不同的栈*/

}

输出结果：

&f_jingtai: 404020

&f_jubu : 22ff40

&quanju : 404070

&m_jubu : 22ff74

&m_jingtai: 404010

m_zifuc : 403000

&m_zifuc : 22ff6c

m_zifum : 3d24e0

&m_zifum : 22ff70

pfun : 4013af

&pfun : 22ff68

分析：

堆区:

m_zifum : 3d24e0

代码区:

pfun : 4013af

局区/静态区（static）:

m_zifuc : 403000

&m_jingtai: 404010

&f_jingtai: 404020

&quanju : 404070

栈区:

&f_jubu : 22ff40 fun函数栈区

&pfun : 22ff68 主函数栈区

&m_zifuc : 22ff6c

&m_zifum : 22ff70

&m_jubu : 22ff74

二、堆和栈

1申请方式

stack:

由系统自动分配。例如，声明在函数中一个局部变量 int b; 系统自动在栈中为b开辟空间

heap:

需要程序员手动申请，并指明大小，在c中，有malloc函数完成

如p1 = (char *)malloc(10);

在C++中用new运算符

如p2 = (char *)malloc(10);

但是注意p1、p2本身是在栈中的。

2 申请后系统的响应

栈：只要栈的剩余空间大于所申请空间，系统将为程序提供内存，否则将报异常提示栈溢出。

堆：大多数操作系统有一个记录空闲内存地址的链表，当系统收到程序的申请时，会遍历该链表，寻找第一个空间大于所申请空间的堆结点，然后将该结点从空闲结点链表中删除，并将该结点的空间分配给程序，另外，对于大多数系统，会在这块内存空间中的首地址处记录本次分配的大小，这样，代码中的free函数才能正确的释放本内存空间。另外，由于找到的堆结点的大小不一定正好等于申请的大小，系统会自动的将多余的那部分重新放入空闲链表中。

3申请大小的限制

栈：在Windows下,栈是向低地址扩展的数据结构，是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的，在WINDOWS下，栈的大小是2M（也有的说是1M，总之是一个编译时就确定的常数），如果申请的空间超过栈的剩余空间时，将提示overflow。因此，能从栈获得的空间较小。

堆：堆是向高地址扩展的数据结构，是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的，自然是不连续的，而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见，堆获得的空间比较灵活，也比较大。

4申请效率的比较：

栈由系统自动分配，速度较快。但程序员是无法控制的。

堆是由程序员手动分配的内存，一般速度比较慢，而且容易产生内存碎片,不过用起来最方便.

另外，在WINDOWS下，最好的方式是用VirtualAlloc分配内存，他不是在堆，也不是在栈是直接在进程的地址空间中保留一快内存，虽然用起来最不方便。但是速度快，也最灵活。

5堆和栈中的存储内容

栈：在函数调用时，第一个进栈的是函数调用语句的下一条可执行语句的地址，然后是函数的各个参数，在大多数的C编译器中，参数是由右往左入栈的，然后是函数中的局部变量。注意静态变量是不入栈的。当本次函数调用结束后，局部变量先出栈，然后是参数，最后栈顶指针指向最开始存的地址，也就是函数中的下一条指令，程序由该点继续运行。

堆：一般是在堆的头部用一个字节存放堆的大小。堆中的具体内容由程序员安排。

6存取效率的比较

char s1[] = "aaaaaaaaaaaaaaa";

char *s2 = "bbbbbbbbbbbbbbbbb";

aaaaaaaaaaa是在运行时刻赋值的；

而bbbbbbbbbbb是在编译时就确定的；

但是，在以后的存取中，在栈上的数组比指针所指向的字符串(例如堆)快。

比如：

#include

void main()

{

char a = 1;

char c[] = "1234567890";

char *p ="1234567890";

a = c[1];

a = p[1];

return;

}

对应的汇编代码

: a = c[1];

00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]

0040106A 88 4D FC mov byte ptr [ebp-4],cl

: a = p[1];

0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]

00401070 8A 42 01 mov al,byte ptr [edx+1]

00401073 88 45 FC mov byte ptr [ebp-4],al

第一种在读取时直接就把字符串中的元素读到寄存器cl中，而第二种则要先把指针值读到edx中，在根据edx读取字符，显然慢了一些。

2 内存对齐问题

一、内存对齐的原因

大部分的参考资料都是如是说的：

1、平台原因(移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。

2、性能原因：数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。

二、对齐规则

每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。程序员可以通过预编译命令#pragma pack(n)，n=1,2,4,8,16来改变这一系数，其中的n就是你要指定的“对齐系数”。

规则：

1、数据成员对齐规则：结构(struct)(或联合(union))的数据成员，第一个数据成员放在offset为0的地方，以后每个数据成员的对齐按照#pragma pack指定的数值和这个数据成员

自身长度中，比较小的那个进行。

2、结构(或联合)的整体对齐规则：在数据成员完成各自对齐之后，结构(或联合)本身也要进行对齐，对齐将按照#pragma pack指定的数值和结构(或联合)最大数据成员长度中，比较小的那个进行。

3、结合1、2可推断：当#pragma pack的n值等于或超过所有数据成员长度的时候，这个n值的大小将不产生任何效果。

三、试验

下面我们通过一系列例子的详细说明来证明这个规则

编译器：GCC 3.4.2、VC6.0

平台：Windows XP

典型的struct对齐

struct定义：

#pragma pack(n) /* n = 1, 2, 4, 8, 16 */

struct test_t {

int a;

char b;

short c;

char d;

};

#pragma pack(n)

首先确认在试验平台上的各个类型的size，经验证两个编译器的输出均为：

sizeof(char) = 1

sizeof(short) = 2

sizeof(int) = 4

试验过程如下：通过#pragma pack(n)改变“对齐系数”，然后察看sizeof(struct test_t)的值。

1、1字节对齐(#pragma pack(1))

输出结果：sizeof(struct test_t) = 8 [两个编译器输出一致]

分析过程：

1) 成员数据对齐

#pragma pack(1)

struct test_t {

int a; /* 长度4 > 1 按1对齐；起始offset=0 0%1=0；存放位置区间[0,3] */

char b; /* 长度1 = 1 按1对齐；起始offset=4 4%1=0；存放位置区间[4] */

short c; /* 长度2 > 1 按1对齐；起始offset=5 5%1=0；存放位置区间[5,6] */

char d; /* 长度1 = 1 按1对齐；起始offset=7 7%1=0；存放位置区间[7] */

};

#pragma pack()

成员总大小=8

2) 整体对齐

整体对齐系数 = min((max(int,short,char), 1) = 1

整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 8 /* 8%1=0 */ [注1]

2、2字节对齐(#pragma pack(2))

输出结果：sizeof(struct test_t) = 10 [两个编译器输出一致]

分析过程：

1) 成员数据对齐

#pragma pack(2)

struct test_t {

int a; /* 长度4 > 2 按2对齐；起始offset=0 0%2=0；存放位置区间[0,3] */

char b; /* 长度1 < 2 按1对齐；起始offset=4 4%1=0；存放位置区间[4] */

short c; /* 长度2 = 2 按2对齐；起始offset=6 6%2=0；存放位置区间[6,7] */

char d; /* 长度1 < 2 按1对齐；起始offset=8 8%1=0；存放位置区间[8] */

};

#pragma pack()

成员总大小=9

2) 整体对齐

整体对齐系数 = min((max(int,short,char), 2) = 2

整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 10 /* 10%2=0 */

3、4字节对齐(#pragma pack(4))

输出结果：sizeof(struct test_t) = 12 [两个编译器输出一致]

分析过程：

1) 成员数据对齐

#pragma pack(4)

struct test_t {

int a; /* 长度4 = 4 按4对齐；起始offset=0 0%4=0；存放位置区间[0,3] */

char b; /* 长度1 < 4 按1对齐；起始offset=4 4%1=0；存放位置区间[4] */

short c; /* 长度2 < 4 按2对齐；起始offset=6 6%2=0；存放位置区间[6,7] */

char d; /* 长度1 < 4 按1对齐；起始offset=8 8%1=0；存放位置区间[8] */

};

#pragma pack()

成员总大小=9

2) 整体对齐

整体对齐系数 = min((max(int,short,char), 4) = 4

整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 12 /* 12%4=0 */

4、8字节对齐(#pragma pack(8))

输出结果：sizeof(struct test_t) = 12 [两个编译器输出一致]

分析过程：

1) 成员数据对齐

#pragma pack(8)

struct test_t {

int a; /* 长度4 < 8 按4对齐；起始offset=0 0%4=0；存放位置区间[0,3] */

char b; /* 长度1 < 8 按1对齐；起始offset=4 4%1=0；存放位置区间[4] */

short c; /* 长度2 < 8 按2对齐；起始offset=6 6%2=0；存放位置区间[6,7] */

char d; /* 长度1 < 8 按1对齐；起始offset=8 8%1=0；存放位置区间[8] */

};

#pragma pack()

成员总大小=9

2) 整体对齐

整体对齐系数 = min((max(int,short,char), 8) = 4

整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 12 /* 12%4=0 */

5、16字节对齐(#pragma pack(16))

输出结果：sizeof(struct test_t) = 12 [两个编译器输出一致]

分析过程：

1) 成员数据对齐

#pragma pack(16)

struct test_t {

int a; /* 长度4 < 16 按4对齐；起始offset=0 0%4=0；存放位置区间[0,3] */

char b; /* 长度1 < 16 按1对齐；起始offset=4 4%1=0；存放位置区间[4] */

short c; /* 长度2 < 16 按2对齐；起始offset=6 6%2=0；存放位置区间[6,7] */

char d; /* 长度1 < 16 按1对齐；起始offset=8 8%1=0；存放位置区间[8] */

};

#pragma pack()

成员总大小=9

2) 整体对齐

整体对齐系数 = min((max(int,short,char), 16) = 4

整体大小(size)=$(成员总大小) 按 $(整体对齐系数) 圆整 = 12 /* 12%4=0 */

8字节和16字节对齐试验证明了“规则”的第3点：“当#pragma pack的n值等于或超过所有数据成员长度的时候，这个n值的大小将不产生任何效果”。

感谢原创所做出的贡献！

转自：http://blog.csdn.net/cuibo1123/archive/2008/06/14/2547442.aspx

阅读(2911) | 评论(0) | 转发(4) |

上一篇：C_指针（二）

下一篇：vim学习手册-4编辑相关

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6