内存管理子系统（国嵌学习笔记）-特殊借口-ChinaUnix博客

特殊借口

首页　| 　博文目录　| 　关于我

特殊借口

博客访问： 260003
博文数量： 52
博客积分： 0
博客等级：民兵
技术积分： 1538
用户组：普通用户
注册时间： 2013-04-24 07:45

个人简介

生活就像海洋，只有意志坚强的人，才能到达彼岸。

文章分类

全部博文（52）

文章存档

2013年（52）

我的朋友

相关博文

内存管理子系统（国嵌学习笔记）

分类： LINUX

2013-08-17 15:32:47

一、Linux内存管理

1>内存管理子系统

内存是Linux内核所管理的最重要的资源之一，内存管理子系统是操作系统中最重要的部分之一。对于立志从事内核开发的工程师来说，熟悉Linux的内存管理系统非常重要。

2>地址类型

a、物理地址

物理地址是指出现在CPU地址总线上的寻址物理内存的地址信号，是地址变换的最终结果。

b、线性地址（虚拟地址）

线性地址又名虚拟地址，在32位CPU架构下，可以表示4G的地址空间，用16进制表示就是0x00000000到0xffffffff。

c、逻辑地址

程序代码经过编译后，出现在汇编程序中的地址。

d、地址转换

1>段式管理

CPU要将一个逻辑地址转换为物理地址，需要两步：首先CPU利用段式内存管理单元（Semented unit），将逻辑地址转换成线性地址，再利用页式内存管理单元(Paging unit)，把线性地址最终转换为物理地址。

e、什么是段式管理、页式管理？

16位CPU内部拥有20位的地址线，它的寻址范围就是2的20次，也就是1M的内存空间。但是16位的CPU用于存放地址的寄存器（IP、SP.....）只有16位，因此只能访问65536个存储单元，64K。为了能够访问1M的内存空间，CPU就采用内存分段的管理模式，并在CPU内部加入了段寄存器。16位CPU把1M内存空间分为若干个逻辑段，每个逻辑段的要求如下：

1、逻辑段的起始地址（段地址）必须是16的倍数，即最后4个二进制位必须全为0.

2、逻辑段的最大容量为64K。

f、物理地址的形成方式：

由于段地址必须是16的倍数，所以值得一般形式为XXXX0H,即前16位二进制是变化的，可以只保存前16位二进制位来保存整个段基地址，所以每次使用时要用段寄存器左移补4个0（乘以16）来得到实际的段地址。在确定某个存储单元所属的段后，只是知道了存储单元所属的范围（段弟子->段地址+65536），如果想确定该内存单元的具体位置，还必须知道该单元在段内的偏移。有了段地址和偏移量，就可以唯一的确定内存单元在存储器中的具体位置。

逻辑地址=段基地址+段内偏移量

PA=段寄存器的值*16+逻辑地址

段寄存器时为了对内存进行分段管理而增加的，16位CPU有四个段寄存器，程序可同时访问四个不同的含义的段。

1）CS + IP：用于代码段的访问，CS指向存放程序的段基址，IP指向下条要执行的指令在CS段的偏移量，用这两个寄存器就可以得到一个内存物理地址，该地址存放着一条要执行的指令。

2）SS + SP：用于堆栈段的访问，SS指向堆栈的基地址，SP指向栈顶，可以通过SS和SP两个寄存器直接访问栈顶单元的内存物理位置。

3）DS + BX：用于数据段的访问。DS中的值左移四位得到数据段的起始地址，再加上BX中的偏移量，得到一个存储单元的物理地址。

4）ES + BX：用于附加段的访问。ES中的值左移四位得到附加段的起始地址，再加上BX中的偏移量，得到一个存储单元的物理地址。

32位的pc的内存管理任然采用“分段”的管理模式，逻辑地址同样由段地址和偏移量量部分组成，32位pc的内存管理和16位的pc内存管理有相同之处也有不同之处，因为32位的pc采用过了两种不同的工作方式：实模式和保护模式。

1）实模式

在实模式下，32位CPU的内存管理与16位的CPU是一致的。

2）保护模式

段基地址长达32位，每个段的最大容量可达4G，段寄存器的值时段地址的“选择器"（selector）用该"选择器"从内存中得到一个32位的段地址，存储单元的物理地址就是该段地址加上段内偏移量。

2>页式管理

从管理和效率的角度出发，线性地址被分为固定长度的组，称为页（page），例如32位的机器，线性地址最大可为4G，如果用4KB为一个页来划分，这样整个线性地址就被划分为2的20次方个页。

另一类“页”，称之为物理页，或者是页框‘页帧。分页单元把所有的物理内存划分为固定长度的管理单位，它的长度一般与线性地址页是相同的。

1、装入进程的页目录地址（操作系统在调度进程时，把这个地址装入CR3）

2、根据线性地址的前十位，在页目录中，找到对应的索引项，页目录中的项是一个页表的地址

3、根据线性地址的中间十位，在页表中找到页的起始地址

4、将页的起始地址与线性地址的最后12位相加，得到物理地址

问题：这样的二级模式是否能够覆盖4G的物理地址空间？为什么？

答：页目录共有：2^10项，也就是说有这么多个页表；每个页表对应了：2^10页；每个页中可寻址：2^12个字节。 2^32=4GB.

Linux内核的设计没有采用intel所提供的段机制，仅仅是有限度地使用了分段机制。这不仅简化了Linux内核的设计，而且为把Linux移植到其他平台创造了条件，因为很多RISC处理器并不支持段机制。所有段的基地址均为0，由此可以得出，每个段的逻辑地址空间范围为0-4GB。因为每个段的基地址为0，因此，逻辑地址与线性地址保持一致（即逻辑地址的偏移量字段的值与线性地址的值总是相同的），在Linux中所提到的逻辑地址和线性地址（虚拟地址），可以认为是一致的，看来，Linux巧妙地把段机制给绕过去了，而完全利用了分页机制。

Linux 2.6.29内核为每种CPU提供统一的界面，采用了四级页管理架构，来兼容二级、三级、四级管理架构的CPU。

二、Linux进程地址空间

1>虚拟内存

Linux操作系统采用虚拟内存管理技术，使得每个进程都有独立的进程地址空间，该空间是大小

为3G，用户看到和接触的都是虚拟地址，无法看到实际的物理地址。利用这种虚拟地址不但能起到保

护操作系统的作用，而且更重要的是用户程序可使用比实际物理内存更大的地址空间。Linux将4G的

虚拟地址空间划分为两个部分——用户空间和内核空间。用户空间从0到0xffffffff，内核空间从3G

到4G。用户进程通常情况下只能访问用户空间的虚拟地址，不能访问内核空间。例外情况是用户进程

通过系统调用访问内核空间。

2>进程空间

用户空间进程，所以每当进程切换，用户空间就会跟着变化，每个进程的用户空间都是完全独

立、互不相干的。把一个程序同时运行10次会看到10个进程使用的线性地址一模一

样。cat/proc//maps。

创建进程fork()、程序载入execve()、动态内存分配malloc()等进程相关的操作都需要分配内存

给进程。这时进程申请和获得的不是物理地址，仅仅是虚拟地址。实际的物理内存只有当进程真的去

访问新获取的虚拟地址时，才会由“请页机制”产生“缺页”异常，才会进入分配实际页框的程序。

该异常是虚拟内存机制赖以存在的基本保证——它会告诉内核去为进程分配物理页，并建立对应的页

表，这之后虚拟地址才实实在在地映射到了物理地址上。

3>内核内存分配

在应用程序中，常使用malloc函数进行动态内存分配，而在Linux内核中，通常使用kmalloc来动

态分配内存。kmalloc的原型：

#include

void* kmalloc(size_t size, int flags)

参数：

size：要分配的内存大小。

flags：分配标志，它控制kmalloc的行为。

分配标志：

GFP_ATOMIC：用来在进程上下文之外的代码（包括中断处理）中分配内存，从不睡眠。

GFP_KERNEL：进程上下文中的分配。可能睡眠。（16M-896M）

__GFP_DMA：这个标志要求分配能够DMA的内存区（物理地址在16M以下的页帧）

__GFP_HIGHMEM：这个标志标志分配的内存位于高端内存。（896M以上）

4>按页分配

如果模块需要分配大块的内存，那么使用面向页的分配技术会更好。

get_zerode_page(unsigned int flags)

返回指向新页的指针，并将页面清零。

__get_free_page(unsigned int flags)

和get_free_page类似，但不清零页面。

__get_free_pages(unsigned int flags, unsigned int order)

分配若干个连续的页面，返回指向该内存区域的指针，但也不清零这段内存区域。

当程序用完这些页，可以使用下列函数之一来释放它们：

void free_page(unsigned long addr)

void free_pages(unsigned long addr, unsigned long order)

如果释放的和先前分配数目不等的页面，会导致系统错误。

5>内存使用

三、Linux内核地址空间

1>:

内核空间是由负责映射，并不会跟着进程改变，是固定的。

物理内存896MB以上的部分称之为高端内存。

2>内核空间分布

3G 4G

直接映射区 | 8M | 动态映射区 | 8K | KMAP区 | 固定映射区 | 4K

896M（max）| 120M（min） | 4M | 4M

1）直接映射区（Direct Memory Region）:从3G开始，最大896M的线性地址区间，我们称作直接内存

映射区，这是因为该区域的线性地址和物理地址之间存在线性转换关系

线性地址 = 3G + 物理地址

2）动态内存映射区（Vmalloc Region）：该区域的地址由内核函数vmalloc来进行分配，其特点是线

性空间连续，但对应的物理空间不一定连续。vmalloc分配的线性地址所对应的物理页可能处于低端

内存，也可能处于高端内存。

3）永久内存映射区（PKMap Region）：对于896M以上的高端内存，可使用该区域来访问，访问方法：

1、使用alloc_page(__GFP_HIGHMEM)分配高端内存页。

2、使用kmap函数将分配到高端内存映射到该区域。

4）固定映射区（Fixing Mapping Region）：PKMap区上面，有4M的线性空间，被称作固定映射区，

它和4G顶端只要4K的隔离带。固定映射区中每个地址项都服务于特定的用途，如ACPI_BASE等。

四、Linux内核链表

1>内核链表的简介

通常链表数据结构至少包含两个域：数据域和指针域，数据域用于存储数据，指针域用于建立与

下一个结点的联系，按照指针域的组织以及各结点之间的联系形式，链表又可以分为单链表，双链

表，循环链表等多种类型。在linux内核中使用了大量的链表结构组织数据。这些链表大多采用了

[include/linux/list.h]中实现的一套精彩的链表数据结构。

2>内核链表

链表数据结构的定义：

struct list_head

{

struct list_head *next,*prev;

};

list_head结构包含两个指向list_head结构的指针prev和next，由此可见，内核的链表具备双链表功

能，实际上，通常它都组织成双向循环链表。

3>链表操作

1）初始化链表头

INIT_LIST_HEAD（list_head* head）

2)插入节点

list_add(struct list_head* new, struct list_head* head)

list_add_tail(struct list_head* new,struct list_head* head)

3)删除节点

list_del(struct list_head* entry)

4)提取数据结构

list_entry(ptr,type,member)

已知数据结构中的节点指针ptr，找出数据结构，例：list_entry(aup,struct autofs,list)

5)遍历

list_for_each(struct list_head* pos, struct list_head* head)

例：

struct list_head* entry;

struct list_head cs46xx_devs;//链表头

list_for_each(entry, &cs46xx_devs)

{

card = list_entry(entry,struct cs_card, list);

if(card->dev_midi == minor)

break;

}

点击(此处)折叠或打开

/*******************mylist.c实例分析****************************/
#include <linux/kernel.h>
#include <linux/module.h>
#include <linux/init.h>
#include <linux/slab.h>
#include <linux/list.h>
MODULE_LICENSE("GPL");
MODULE_AUTHOR("David Xie");
MODULE_DESCRIPTION("List Module");
MODULE_ALIAS("List module");
struct student
{
char name[100];
int num;
struct list_head list;
};
struct student *pstudent;
struct student *tmp_student;
struct list_head student_list;
struct list_head *pos;
int mylist_init(void)
{
int i = 0;
INIT_LIST_HEAD(&student_list);
pstudent = kmalloc(sizeof(struct student)*5,GFP_KERNEL);
memset(pstudent,0,sizeof(struct student)*5);
for(i=0;i<5;i++)
{
sprintf(pstudent[i].name,"Student%d",i+1);
pstudent[i].num = i+1;
list_add( &(pstudent[i].list), &student_list);
}
list_for_each(pos,&student_list)
{
tmp_student = list_entry(pos,struct student,list);
printk("<0>student %d name: %s\n",tmp_student->num,tmp_student->name);
}
return 0;
}
void mylist_exit(void)
{
int i ;
/* 实验：将for换成list_for_each来遍历删除结点，观察要发生的现象，并考虑解决办法 */
for(i=0;i<5;i++)
{
list_del(&(pstudent[i].list));
}
kfree(pstudent);
}
module_init(mylist_init);
module_exit(mylist_exit);

五、Linux内核定时器

1>度量时间差

时钟中断由系统的定时时硬件以周期性的时间间隔产生，这个间隔（即频率）由内核根据HZ来确

定，HZ是一个与体系结构无关的常数，可配置（50-1200），在X86平台，默认值为1000。每当时钟中

断发生时，全局变量jifiies（unsigned long）就加1，因此jiffies记录了字Linux启动后时钟中断

发生的次数。驱动程序利用jiffies来计算不同事件间的时间间隔。

2>延迟执行

如果延迟的精度要求不高，最简单的实现方法如下--忙等待：

unsigned long j = jiffies + jit_delay*HZ;

while(jiffies < j )

{

/*do nothing*/

}

3>内核定时器

定时器用于控制某个函数（定时器处理函数）在未来的某个特定时间执行。内核定时器注册的处

理函数只执行一次——不是循环执行的。

内核定时器被组织成双向链表，并使用struct timer_list结构描述：

struct timer_list{

struct list_head entry;/*内核使用*/

unsigned long expires;/*超时的jiffies*/

void (*funnction)(unsigned long);/*超时处理函数*/

unsigned long data;/*超时处理函数参数*/

struct tvec_base* base;/*内核使用*/

}；

操作定时器的有如下函数：

void init_timer(struct timer_list* timer); 初始化定时器队列结构。

void add_timer(struct timer_list* timer);启动定时器。

int del_timer(struct timer_list* timer);在定时器超时前将它删除。当定时器超时后，系统会自

动的将它删除。

点击(此处)折叠或打开

/************timer.c实例分析****************************/
#include <linux/kernel.h>
#include <linux/module.h>
#include <linux/init.h>
#include <linux/timer.h> /*timer*/
#include <asm/uaccess.h> /*jiffies*/
MODULE_LICENSE("GPL");
MODULE_AUTHOR("David Xie");
MODULE_DESCRIPTION("Timer Module");
MODULE_ALIAS("timer module");
static int times = 1;
module_param(times, int, S_IRUGO);
struct timer_list timer;
void timer_function(unsigned long para)
{
static int count=1;
if (count <= para){
if (1==count)
printk("<1>\nTimer counter begins:");
printk("<1>count = %d", count);
mod_timer(&timer, jiffies + (HZ/2));
}else{
printk("<1>###");
printk("<1>Timer expired %ld(specified by para) times,\n"
"and you should remove the module to destroy it\n", para);
}
count++;
}
int __init timer_init(void)
{
init_timer(&timer);
timer.data = times;
timer.expires = jiffies + (HZ/2);
timer.function = timer_function;
add_timer(&timer);
return 0;
}
void __exit timer_exit(void)
{
del_timer(&timer);
printk("<1>Timer has been destroyed\n");
}
module_init(timer_init);
module_exit(timer_exit);

阅读(1850) | 评论(1) | 转发(0) |

上一篇：栈的定义与实现

下一篇：栈的应用实战--字符匹配

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6