从历史上讲,C程序一直由下面几部分组成:
(1)正文段。
这是由CPU执行的机器指令部分。通常,正文段是可共享的,所以即使是频繁执行的程序(如文本编辑器、C编译器和shell等)在存储器中也只需有一个副本,另外,正文段常常是只读的,以防止程序由于意外而修改其自身的指令。
(2)初始化数据段。
通常将此段称为数据段,它包含了程序中需要明确地赋初值的变量。例如,C程序中出现在任何函数之外的声明:
int maxcount = 99;
使此变量带有其初值存放在初始化数据段中。
(3)非初始化数据段。
通常将此段称为bss段,这一名称来源于一个早期的汇编运算符,意思是“block started by symbol”(由符号开始的块),在程序开始执行之前,内核将此段中的数据初始化为0或空指针。出现在任何函数外的C声明:
long sum[1000];
使此变量存放在非初始化数据段中。
(4)栈。
自动变量以及每次函数调用时所需保存的信息都存放在此段中。每次调用函数时,其返回地址以及调用者的环境信息(例如某些机器寄存器的值)都存放在栈中。然后,最近被调用的函数在栈上为其自动和临时变量分配存储空间。通过以这种方式使用栈,可以递归调用C函数。递归函数每次调用自身时,就使用一个新的栈帧,因此一个函数调用实例中的变量集不会影响另一个函数调用实例中的变量。
(5)堆。
通常在堆中进行动态存储分配。由于历史上形成的惯例,堆位于非初始化数据段和栈之间。
下图是这种典型的存储器内存布局图:
图1 内存布局图
对于x86处理器上的Linux,正文段从0x08048000单元开始,栈底则在0xC0000000之下开始(在这种特定结构中,栈从高地址向低地址方向增长)。堆顶和栈底之间未用的虚拟空间很大。
从上图中可以看到,未初始化数据段的内容并不存放在磁盘上的程序文件中。其原因是,内核在程序开始运行前将它们都设置为0.需要存放在程序文件中的段只有正文段和初始化数据段 。
size(1)命令报告正文段、数据段和bss段的长度(单位:字节)。例如:
#size /usr/bin/cc /bin/sh
text data bss dec hex filename
79606 1536 916 82058 1408a /usr/bin/cc
619234 21120 18260 658614 a0cb6 /bin/sh
第4列和第5列是分别以十进制和十六进制表示的三个段的总长度。
需要注意的是:a.out中还有若干其它类型的段,例如,包含符号表的段、包含调试信息的段以及包含动态共享库链接表的段等等。这些部分并不装载到进程执行的程序映像中。
阅读(1386) | 评论(0) | 转发(0) |