Chinaunix首页 | 论坛 | 博客
  • 博客访问: 357664
  • 博文数量: 213
  • 博客积分: 566
  • 博客等级: 中士
  • 技术积分: 1210
  • 用 户 组: 普通用户
  • 注册时间: 2011-03-21 13:09
文章分类

全部博文(213)

文章存档

2015年(1)

2013年(7)

2012年(128)

2011年(77)

分类:

2011-05-22 15:41:00

一、一般C/C++程序占用的内存主要分为5

    1、栈区(stack):类似于堆栈,由程序自动创建、自动释放。函数参数、局部变量以及返回点等信息都存于其中。

    2、堆区(heap): 使用自由,不需预先确定大小。多数情况下需要由程序员手动申请、释放。如不释放,程序结束后由操作系统垃圾回收机制收回。

    3、全局区/静态区(static):全局变量和静态变量的存储是区域。程序结束后由系统释放。

    4、文字常量区:常量字符串就是放在这里的。 程序结束后由系统释放。

5、程序代码区:既可执行代码。

 

例:

#include

int quanju;/*全局变量,全局区/静态区(static*/

void fun(int f_jubu); /*程序代码区*/

int main(void)/**/

{

       int m_jubu;/*栈区(stack*/

       static int m_jingtai;/*静态变量,全局区/静态区(static*/

       char *m_zifum,*m_zifuc = "hello";/*指针本身位于栈。指向字符串"hello",位于文字常量区*/

       void (*pfun)(int); /*栈区(stack*/

       pfun=&fun;

       m_zifum = (char *)malloc(sizeof(char)*10);/*指针内容指向分配空间,位于堆区(heap*/

       pfun(1);

       printf("&quanju   : %x\n",&quanju);

       printf("&m_jubu   : %x\n",&m_jubu);

       printf("&m_jingtai: %x\n",&m_jingtai);

       printf("m_zifuc   : %x\n",m_zifuc);

       printf("&m_zifuc  : %x\n",&m_zifuc);

       printf("m_zifum   : %x\n",m_zifum);

       printf("&m_zifum  : %x\n",&m_zifum);

       printf("pfun      : %x\n",pfun);

       printf("&pfun     : %x\n",&pfun);

       getch();

       return 0;

}

void fun(int f_jubu)

{

       static int f_jingtai;

       printf("&f_jingtai: %x\n",&f_jingtai);

       printf("&f_jubu   : %x\n",&f_jubu);/*栈区(stack,但是与主函数中m_jubu位于不同的栈*/

}

 

输出结果:

&f_jingtai: 404020

&f_jubu   : 22ff40

&quanju   : 404070

&m_jubu   : 22ff74

&m_jingtai: 404010

m_zifuc   : 403000

&m_zifuc  : 22ff6c

m_zifum   : 3d24e0

&m_zifum  : 22ff70

pfun      : 4013af

&pfun     : 22ff68

 

分析:

堆区:

       m_zifum   : 3d24e0

代码区:

       pfun      : 4013af

局区/静态区(static:

       m_zifuc   : 403000 

       &m_jingtai: 404010

       &f_jingtai: 404020

       &quanju   : 404070

栈区:

       &f_jubu   : 22ff40 fun函数栈区

       &pfun     : 22ff68 主函数栈区 

       &m_zifuc  : 22ff6c

       &m_zifum  : 22ff70

       &m_jubu   : 22ff74

 

二、堆和栈

1申请方式

stack:

由系统自动分配。 例如,声明在函数中一个局部变量 int b; 系统自动在栈中为b开辟空间

heap:

需要程序员手动申请,并指明大小,在c中,有malloc函数完成

p1 = (char *)malloc(10);

C++中用new运算符

p2 = (char *)malloc(10);

但是注意p1p2本身是在栈中的。 

 

申请后系统的响应

栈:只要栈的剩余空间大于所申请空间,系统将为程序提供内存,否则将报异常提示栈溢出。

堆:大多数操作系统有一个记录空闲内存地址的链表,当系统收到程序的申请时,会遍历该链表,寻找第一个空间大于所申请空间的堆结点,然后将该结点从空闲结点链表中删除,并将该结点的空间分配给程序,另外,对于大多数系统,会在这块内存空间中的首地址处记录本次分配的大小,这样,代码中的free函数才能正确的释放本内存空间。另外,由于找到的堆结点的大小不一定正好等于申请的大小,系统会自动的将多余的那部分重新放入空闲链表中。

 

3申请大小的限制

栈:在Windows,栈是向低地址扩展的数据结构,是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的,在WINDOWS下,栈的大小是2M(也有的说是1M,总之是一个编译时就确定的常数),如果申请的空间超过栈的剩余空间时,将提示overflow。因此,能从栈获得的空间较小。

堆:堆是向高地址扩展的数据结构,是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的,自然是不连续的,而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见,堆获得的空间比较灵活,也比较大。

 

4申请效率的比较:

栈由系统自动分配,速度较快。但程序员是无法控制的。

堆是由程序员手动分配的内存,一般速度比较慢,而且容易产生内存碎片,不过用起来最方便.

另外,在WINDOWS下,最好的方式是用VirtualAlloc分配内存,他不是在堆,也不是在栈是直接在进程的地址空间中保留一快内存,虽然用起来最不方便。但是速度快,也最灵活。

 

5堆和栈中的存储内容

栈: 在函数调用时,第一个进栈的是函数调用语句的下一条可执行语句的地址,然后是函数的各个参数,在大多数的C编译器中,参数是由右往左入栈的,然后是函数中的局部变量。注意静态变量是不入栈的。 当本次函数调用结束后,局部变量先出栈,然后是参数,最后栈顶指针指向最开始存的地址,也就是函数中的下一条指令,程序由该点继续运行。

堆:一般是在堆的头部用一个字节存放堆的大小。堆中的具体内容由程序员安排。

 

6存取效率的比较

char s1[] = "aaaaaaaaaaaaaaa";

char *s2 = "bbbbbbbbbbbbbbbbb";

aaaaaaaaaaa是在运行时刻赋值的;

bbbbbbbbbbb是在编译时就确定的;

但是,在以后的存取中,在栈上的数组比指针所指向的字符串(例如堆)快。

比如:

#include

void main()

{

char a = 1;

char c[] = "1234567890";

char *p ="1234567890";

a = c[1];

a = p[1];

return;

}

对应的汇编代码

: a = c[1];

00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]

0040106A 88 4D FC mov byte ptr [ebp-4],cl

: a = p[1];

0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]

00401070 8A 42 01 mov al,byte ptr [edx+1]

00401073 88 45 FC mov byte ptr [ebp-4],al

第一种在读取时直接就把字符串中的元素读到寄存器cl中,而第二种则要先把指针值读到edx中,在根据edx读取字符,显然慢了一些。

 

内存对齐问题

 

一、内存对齐的原因

大部分的参考资料都是如是说的:

1、平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。

2、性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

 

二、对齐规则

每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。程序员可以通过预编译命令#pragma pack(n)n=1,2,4,8,16来改变这一系数,其中的n就是你要指定的“对齐系数”。

规则:

1、数据成员对齐规则:结构(struct)(或联合(union))的数据成员,第一个数据成员放在offset0的地方,以后每个数据成员的对齐按照#pragma pack指定的数值和这个数据成员

自身长度中,比较小的那个进行。

2、结构(或联合)的整体对齐规则:在数据成员完成各自对齐之后,结构(或联合)本身也要进行对齐,对齐将按照#pragma pack指定的数值和结构(或联合)最大数据成员长度中,比较小的那个进行。

3、结合12可推断:当#pragma packn值等于或超过所有数据成员长度的时候,这个n值的大小将不产生任何效果。

 

三、试验

下面我们通过一系列例子的详细说明来证明这个规则

编译器:GCC 3.4.2VC6.0

平台:Windows XP

 

典型的struct对齐

struct定义:

#pragma pack(n) /* n = 1, 2, 4, 8, 16 */

struct test_t {

 int a;

 char b;

 short c;

 char d;

};

#pragma pack(n)

首先确认在试验平台上的各个类型的size,经验证两个编译器的输出均为:

sizeof(char) = 1

sizeof(short) = 2

sizeof(int) = 4

 

试验过程如下:通过#pragma pack(n)改变“对齐系数”,然后察看sizeof(struct test_t)的值。

 

11字节对齐(#pragma pack(1))

输出结果:sizeof(struct test_t) = 8 [两个编译器输出一致]

分析过程:

1) 成员数据对齐

#pragma pack(1)

struct test_t {

 int a;  /* 长度4 > 1 1对齐;起始offset=0 0%1=0;存放位置区间[0,3] */

 char b;  /* 长度1 = 1 1对齐;起始offset=4 4%1=0;存放位置区间[4] */

 short c; /* 长度2 > 1 1对齐;起始offset=5 5%1=0;存放位置区间[5,6] */

 char d;  /* 长度1 = 1 1对齐;起始offset=7 7%1=0;存放位置区间[7] */

};

#pragma pack()

成员总大小=8

 

2) 整体对齐

整体对齐系数 = min((max(int,short,char), 1) = 1

整体大小(size)=$(成员总大小 $(整体对齐系数圆整 = 8 /* 8%1=0 */ [1]

 

22字节对齐(#pragma pack(2))

输出结果:sizeof(struct test_t) = 10 [两个编译器输出一致]

分析过程:

1) 成员数据对齐

#pragma pack(2)

struct test_t {

 int a;  /* 长度4 > 2 2对齐;起始offset=0 0%2=0;存放位置区间[0,3] */

 char b;  /* 长度1 < 2 1对齐;起始offset=4 4%1=0;存放位置区间[4] */

 short c; /* 长度2 = 2 2对齐;起始offset=6 6%2=0;存放位置区间[6,7] */

 char d;  /* 长度1 < 2 1对齐;起始offset=8 8%1=0;存放位置区间[8] */

};

#pragma pack()

成员总大小=9

2) 整体对齐

整体对齐系数 = min((max(int,short,char), 2) = 2

整体大小(size)=$(成员总大小 $(整体对齐系数圆整 = 10 /* 10%2=0 */

 

34字节对齐(#pragma pack(4))

输出结果:sizeof(struct test_t) = 12 [两个编译器输出一致]

分析过程:

1) 成员数据对齐

#pragma pack(4)

struct test_t {

 int a;  /* 长度4 = 4 4对齐;起始offset=0 0%4=0;存放位置区间[0,3] */

 char b;  /* 长度1 < 4 1对齐;起始offset=4 4%1=0;存放位置区间[4] */

 short c; /* 长度2 < 4 2对齐;起始offset=6 6%2=0;存放位置区间[6,7] */

 char d;  /* 长度1 < 4 1对齐;起始offset=8 8%1=0;存放位置区间[8] */

};

#pragma pack()

成员总大小=9

 

2) 整体对齐

整体对齐系数 = min((max(int,short,char), 4) = 4

整体大小(size)=$(成员总大小 $(整体对齐系数圆整 = 12 /* 12%4=0 */

 

48字节对齐(#pragma pack(8))

输出结果:sizeof(struct test_t) = 12 [两个编译器输出一致]

分析过程:

1) 成员数据对齐

#pragma pack(8)

struct test_t {

 int a;  /* 长度4 < 8 4对齐;起始offset=0 0%4=0;存放位置区间[0,3] */

 char b;  /* 长度1 < 8 1对齐;起始offset=4 4%1=0;存放位置区间[4] */

 short c; /* 长度2 < 8 2对齐;起始offset=6 6%2=0;存放位置区间[6,7] */

 char d;  /* 长度1 < 8 1对齐;起始offset=8 8%1=0;存放位置区间[8] */

};

#pragma pack()

成员总大小=9

2) 整体对齐

整体对齐系数 = min((max(int,short,char), 8) = 4

整体大小(size)=$(成员总大小 $(整体对齐系数圆整 = 12 /* 12%4=0 */

 

516字节对齐(#pragma pack(16))

输出结果:sizeof(struct test_t) = 12 [两个编译器输出一致]

分析过程:

1) 成员数据对齐

#pragma pack(16)

struct test_t {

 int a;  /* 长度4 < 16 4对齐;起始offset=0 0%4=0;存放位置区间[0,3] */

 char b;  /* 长度1 < 16 1对齐;起始offset=4 4%1=0;存放位置区间[4] */

 short c; /* 长度2 < 16 2对齐;起始offset=6 6%2=0;存放位置区间[6,7] */

 char d;  /* 长度1 < 16 1对齐;起始offset=8 8%1=0;存放位置区间[8] */

};

#pragma pack()

成员总大小=9

 

2) 整体对齐

整体对齐系数 = min((max(int,short,char), 16) = 4

整体大小(size)=$(成员总大小 $(整体对齐系数圆整 = 12 /* 12%4=0 */

8字节和16字节对齐试验证明了“规则”的第3点:“当#pragma packn值等于或超过所有数据成员长度的时候,这个n值的大小将不产生任何效果”。



感谢原创所做出的贡献!

转自:http://blog.csdn.net/cuibo1123/archive/2008/06/14/2547442.aspx

阅读(702) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~