Chinaunix首页 | 论坛 | 博客
  • 博客访问: 242170
  • 博文数量: 60
  • 博客积分: 1509
  • 博客等级: 上尉
  • 技术积分: 882
  • 用 户 组: 普通用户
  • 注册时间: 2011-01-15 10:30
文章分类

全部博文(60)

文章存档

2012年(2)

2011年(58)

分类: C/C++

2011-02-12 17:17:08

BSS段:BSS段(bss segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域。BSS是英文Block Started by Symbol的简称。BSS段属于静态内存分配。

数据段:数据段(data segment)通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。

代码段:代码段(code segment/text segment)通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定,并且内存区域通常属于只读, 某些架构也允许代码段为可写,即允许修改程序。在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等。

堆(heap):堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)

(stack):栈又称堆栈, 是用户存放程序临时创建的局部变量,也就是说我们函数括弧“{}”中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变量)。除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。由于栈的先进先出特点,所以栈特别方便用来保存/恢复调用现场。从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。
cl编译两个小程序如下:
程序1:
  1. int ar[30000];
  2. void main()
  3. {
  4.     ......
  5. }
  6. //程序2:
  7. int ar[300000] = {1, 2, 3, 4, 5, 6 };
  8. void main()
  9. {
  10.     ......
  11. }

发现程序2编译之后所得的.exe文件比程序1的要大得多。当下甚为不解,于是手工编译了一下,并使用了/FAs编译选项来查看了一下其各自的.asm,发现在程序1.asmar的定义如下:

  1. _BSS SEGMENT
  2. ?ar@@3PAHA DD 0493e0H DUP (?) ; ar
  3. _BSS ENDS

而在程序2.asm中,ar被定义为:

  1. _DATA SEGMENT
  2. ?ar@@3PAHA DD 01H ; ar
  3. DD 02H
  4. DD 03H
  5. ORG $+1199988
  6. _DATA ENDS

区别很明显,一个位于.bss段,而另一个位于.data段,两者的区别在于:全局的未初始化变量存在于.bss段中,具体体现为一个占位符;全局的已初始化变量存于.data段中;而函数内的自动变量都在栈上分配空间。.bss是不占用.exe文件空间的,其内容由操作系统初始化(清零);而.data却需要占用,其内容由程序初始化,因此造成了上述情况。
【例二】

编译如下程序(test.cpp):

 

  1. #include <stdio.h>
  2.   
  3. #define LEN 1002000
  4.   
  5. int inbss[LEN];
  6. float fA;
  7. int indata[LEN]={1,2,3,4,5,6,7,8,9};
  8. double dbB = 100.0;
  9.   
  10. const int cst = 100;
  11.   
  12. int main(void)
  13. {
  14.     int run[100] = {1,2,3,4,5,6,7,8,9};
  15.     for(int i=0; i<LEN; ++i)
  16.         printf("%d ", inbss[i]);
  17.     return 0;
  18. }

命令:cl /FA  test.cpp 回车 (/FA:产生汇编代码)
产生的汇编代码(test.asm):

 

  1. TITLE test.cpp
  2. .386P
  3. include listing.inc
  4. if @Version gt 510
  5. .model FLAT
  6. else
  7. _TEXT SEGMENT PARA USE32 PUBLIC 'CODE'
  8. _TEXT ENDS
  9. _DATA SEGMENT DWORD USE32 PUBLIC 'DATA'
  10. _DATA ENDS
  11. CONST SEGMENT DWORD USE32 PUBLIC 'CONST'
  12. CONST ENDS
  13. _BSS SEGMENT DWORD USE32 PUBLIC 'BSS'
  14. _BSS ENDS
  15. _TLS SEGMENT DWORD USE32 PUBLIC 'TLS'
  16. _TLS ENDS
  17. FLAT GROUP _DATA, CONST, _BSS
  18. ASSUME CS: FLAT, DS: FLAT, SS: FLAT
  19. endif
  20. PUBLIC ?inbss@@3PAHA ; inbss
  21. PUBLIC ?fA@@3MA ; fA
  22. PUBLIC ?indata@@3PAHA ; indata
  23. PUBLIC ?dbB@@3NA ; dbB
  24. _BSS SEGMENT
  25. ?inbss@@3PAHA DD 0f4a10H DUP (?) ; inbss
  26. ?fA@@3MA DD 01H DUP (?) ; fA
  27. _BSS ENDS
  28. _DATA SEGMENT
  29. ?indata@@3PAHA DD 01H ; indata
  30. DD 02H
  31. DD 03H
  32. DD 04H
  33. DD 05H
  34. DD 06H
  35. DD 07H
  36. DD 08H
  37. DD 09H
  38. ORG $+4007964
  39. ?dbB@@3NA DQ 04059000000000000r ; 100 ; dbB
  40. _DATA ENDS
  41. PUBLIC _main
  42. EXTRN _printf:NEAR
  43. _DATA SEGMENT
  44. $SG537 DB '%d ', 00H
  45. _DATA ENDS
  46. _TEXT SEGMENT
  47. _run$ = -400
  48. _i$ = -404
  49. _main PROC NEAR
  50. ; File test.cpp
  51. ; Line 13
  52. push ebp
  53. mov ebp, esp
  54. sub esp, 404 ; 00000194H
  55. push edi
  56. ; Line 14
  57. mov DWORD PTR _run$[ebp], 1
  58. mov DWORD PTR _run$[ebp+4], 2
  59. mov DWORD PTR _run$[ebp+8], 3
  60. mov DWORD PTR _run$[ebp+12], 4
  61. mov DWORD PTR _run$[ebp+16], 5
  62. mov DWORD PTR _run$[ebp+20], 6
  63. mov DWORD PTR _run$[ebp+24], 7
  64. mov DWORD PTR _run$[ebp+28], 8
  65. mov DWORD PTR _run$[ebp+32], 9
  66. mov ecx, 91 ; 0000005bH
  67. xor eax, eax
  68. lea edi, DWORD PTR _run$[ebp+36]
  69. rep stosd
  70. ; Line 15
  71. mov DWORD PTR _i$[ebp], 0
  72. jmp SHORT $L534
  73. $L535:
  74. mov eax, DWORD PTR _i$[ebp]
  75. add eax, 1
  76. mov DWORD PTR _i$[ebp], eax
  77. $L534:
  78. cmp DWORD PTR _i$[ebp], 1002000 ; 000f4a10H
  79. jge SHORT $L536
  80. ; Line 16
  81. mov ecx, DWORD PTR _i$[ebp]
  82. mov edx, DWORD PTR ?inbss@@3PAHA[ecx*4]
  83. push edx
  84. push OFFSET FLAT:$SG537
  85. call _printf
  86. add esp, 8
  87. jmp SHORT $L535
  88. $L536:
  89. ; Line 17
  90. xor eax, eax
  91. ; Line 18
  92. pop edi
  93. mov esp, ebp
  94. pop ebp
  95. ret 0
  96. _main ENDP
  97. _TEXT ENDS
  98. END

通过汇编文件可以看到,数组inbss和indata位于不同的段(inbss位于bss段,而indata位于data段)若把test.cpp中的indata数组拿掉,查看生成的exe文件的大小,可以发现,indata拿掉之后exe文件的大小小了很多。而若拿掉的是inbss数组,exe文件大小跟没拿掉时相差无几。
说明了:
       bss段(未手动初始化的数据)并不给该段的数据分配空间,只是记录数据所需空间的大小。data(已手动初始化的数据)段则为数据分配空间,数据保存在目标文件中。

数据段包含经过初始化的全局变量以及它们的值。BSS段的大小从可执行文件中得到 ,然后链接器得到这个大小的内存块,紧跟在数据段后面。当这个内存区进入程序的地址空间后全部清零。包含数据段和BSS段的整个区段此时通常称为数据区。

阅读(1618) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~