进 程(执行的程序)会占用一定数量的内存,它或是用来存放从磁盘载入的程序代码,或是存放取自用户输入的数据等等。不过进程对这些内存的管理方式因内存用途 不一而不尽相同,有些内存是事先静态分配和统一回收的,而有些却是按需要动态分配和回收的。对任何一个普通进程来讲,它都会涉及到5种不同的数据段。

一、Linux进程的五个段

下面我们来简单归纳一下进程对应的内存空间中所包含的5种不同的数据区都是干什么的。

1)代码段:代码段是用来存放可执行文件的操作指令,也就是说是它是可执行程序在内存中的镜像。代码段需要防止在运行时被非法修改,所以只准许读取操作,而不允许写入(修改)操作——它是不可写的。

2)数据段:数据段用来存放可执行文件中已初始化全局变量,换句话说就是存放程序静态分配的变量和全局变量。

3BSS段:BSS段包含了程序中未初始化的全局变量,在内存中 bss段全部置零。

4)堆(heap):堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)

它的物理内存空间是由程序申请的,并由程序负责释放。

5)栈:栈是用户存放程序临时创建的局部变量,也就是说我们函数括弧“{}”中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变量)。除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。由于栈的先进先出特点,所以栈特别方便用来保存/恢复调用现场。从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。

   它是由操作系统分配的,内存的申请与回收都由OS管理。

举个具体的C语言的例子吧:

//main.c

int a = 0; //全局初始化区

char *p1; //全局未初始化区

main()

{

static int c =0 //全局(静态)初始化区

int b; //

char s[] = "abc"; //

char *p2; //

char *p3 = "123456"; //"123456\0"在常量区,p3在栈上。

p1 = (char *)malloc(10);

p2 = (char *)malloc(20); //分配得来得1020字节的区域就在堆区。

}

二、各个段在内存中的组织

各个段段在线性空间中的组织。直接上图:

+--------------------------------   高地址

+ envstrings 环境变量字串    

+--------------------------------

+ argv string 命令行字串        

+--------------------------------


+ env pointers 环境变量指针表

+--------------------------------

+ argv pointers命令行参数指针表

+--------------------------------

+ argc 命令行参数个数

+--------------------------------


+     main函数的栈帧  

+--------------------------------

+     被调用函数的栈帧

+--------------------------------

+         ......                

+--------------------------------


+       (heap)                

+--------------------------------


+ BSS 未初始化全局数据     

+--------------------------------


+   Data 初始化的全局数据    

+--------------------------------


+   Text 代码段                 

+--------------------------------   

其中,HeapBSSData这三个段在物理内存中是连续存放的,可以这么理解:这三个是一体的。TextStack是独立存放的,这是现在Linux中个段的分布,在0.11中代码段和数据段不是分立的,是在一起的也就是说数据段和代码段是一个段,当然了,堆与BSS也与它们一起了。从0.11的task_struct中还可以看出数据段、堆栈段的描述符是一个,都在ldt[2]处。