Chinaunix首页 | 论坛 | 博客
  • 博客访问: 161670
  • 博文数量: 24
  • 博客积分: 3133
  • 博客等级: 中校
  • 技术积分: 206
  • 用 户 组: 普通用户
  • 注册时间: 2007-12-24 11:08
文章分类

全部博文(24)

文章存档

2010年(4)

2009年(20)

分类: LINUX

2010-08-18 10:38:36


    有这么一系列的问题,是否在困扰着你:用户程序编译连接形成的地址空间在什么范围内?内核编译后地址空间在什么范围内?要对外设进行访问,I/O的地址空间又是什么样的?
    先回答第一个问题。Linux最常见的可执行文件格式为elf(Executable and Linkable Format)。在elf格式的可执行代码中,ld总是从0x8000000开始安排程序的“代码段”,对每个程序都是这样。至于程序执行时在物理内存中的实际地址,则由内核为其建立内存映射时临时分配,具体地址取决于当时所分配的物理内存页面。
    我们可以用Linux的实用程序objdump对你的程序进行反汇编,从而知晓其地址范围。
例如:假定我们有一个简单的C程序Hello.c
          # include
          greeting ( )
          {
              printf(“Hello,world!\n”);
          }
          main()
          {
              greeting();
          }
    之所以把这样简单的程序写成两个函数,是为了说明指令的转移过程。我们用gcc和ld对其进行编译和连接,得到可执行代码hello。然后,用Linux的实用程序objdump对其进行反汇编:
          $objdump –d hello
    得到的主要片段为:
          08048568 :
          8048568:     pushl  %ebp
          8048569:     movl  %esp, %ebp
          804856b:     pushl  $0x809404
          8048570:     call    8048474  <_inIT+0x84>
          8048575:     addl   $0x4, %esp
          8048578:     leave
          8048579:     ret
          804857a:     movl  %esi, %esi
          0804857c
:
          804857c:     pushl  %ebp
          804857d:     movl  %esp, %ebp
          804857f:     call    8048568 
          8048584:     leave
          8048585:     ret
          8048586:     nop
          8048587:     nop
    其中,像08048568这样的地址,就是我们常说的虚地址(这个地址实实在在的存在,只不过因为物理地址的存在,显得它是“虚”的罢了)。
 

虚拟内存、内核空间和用户空间

    Linux虚拟内存的大小为2^32(在32位的x86机器上),内核将这4G字节的空间分为两部分。最高的1G字节(从虚地址0xC0000000到0xFFFFFFFF)供内核使用,称为“内核空间”。而较低的3G字节(从虚地址0x00000000到0xBFFFFFFF),供各个进程使用,称为“用户空间”。因为每个进程可以通过系统调用进入内核,因此,Linux内核空间由系统内的所有进程共享。于是,从具体进程的角度来看,每个进程可以拥有4G字节的虚拟地址空间(也叫虚拟内存)。
   
    每个进程有各自的私有用户空间(0~3G),这个空间对系统中的其他进程是不可见的。最高的1GB内核空间则为所有进程以及内核所共享。另外,进程的“用户空间”也叫“地址空间”,在后面的叙述中,我们对这两个术语不再区分。
用户空间不是进程共享的,而是进程隔离的。每个进程最大都可以有3GB的用户空间。一个进程对其中一个地址的访问,与其它进程对于同一地址的访问绝不冲突。比如,一个进程从其用户空间的地址0x1234ABCD处可以读出整数8,而另外一个进程从其用户空间的地址0x1234ABCD处可以读出整数20,这取决于进程自身的逻辑。
    任意一个时刻,在一个CPU上只有一个进程在运行。所以对于此CPU来讲,在这一时刻,整个系统只存在一个4GB的虚拟地址空间,这个虚拟地址空间是面向此进程的。当进程发生切换的时候,虚拟地址空间也随着切换。由此可以看出,每个进程都有自己的虚拟地址空间,只有此进程运行的时候,其虚拟地址空间才被运行它的CPU所知。在其它时刻,其虚拟地址空间对于CPU来说,是不可知的。所以尽管每个进程都可以有4 GB的虚拟地址空间,但在CPU眼中,只有一个虚拟地址空间存在。虚拟地址空间的变化,随着进程切换而变化。
从上面我们知道,一个程序编译连接后形成的地址空间是一个虚拟地址空间,但是程序最终还是要运行在物理内存中。因此,应用程序所给出的任何虚地址最终必须被转化为物理地址,所以,虚拟地址空间必须被映射到物理内存空间中,这个映射关系需要通过硬件体系结构所规定的数据结构来建立。这就是我们所说的段描述符表和页表,Linux主要通过页表来进行映射。
    于是,我们得出一个结论,如果给出的页表不同,那么CPU将某一虚拟地址空间中的地址转化成的物理地址就会不同。所以我们为每一个进程都建立其页表,将每个进程的虚拟地址空间根据自己的需要映射到物理地址空间上。既然某一时刻在某一CPU上只能有一个进程在运行,那么当进程发生切换的时候,将页表也更换为相应进程的页表,这就可以实现每个进程都有自己的虚拟地址空间而互不影响。所以,在任意时刻,对于一个 CPU 来说,只需要有当前进程的页表,就可以实现其虚拟地址到物理地址的转化。
 

内核空间到物理内存的映射   

    内核空间对所有的进程都是共享的,其中存放的是内核代码和数据,而进程的用户空间中存放的是用户程序的代码和数据,不管是内核程序还是用户程序,它们被编译和连接以后,所形成的指令和符号地址都是虚地址(参见2.5节中的例子),而不是物理内存中的物理地址。
    虽然内核空间占据了每个虚拟空间中的最高 1GB 字节,但映射到物理内存却总是从最低地址( 0x00000000 )开始的,如图 4.2 所示,之所以这么规定,是为了在内核空间与物理内存之间建立简单的线性映射关系。其中, 3GB ( 0xC0000000 )就是物理地址与虚拟地址之间的位移量,在 Linux 代码中就叫做 PAGE_OFFSET 。
                  
    我们来看一下在 include/asm/i386/page.h 头文件中对内核空间中地址映射的说明及定义:
        #define __PAGE_OFFSET           (0xC0000000) 
        …… 
        #define PAGE_OFFSET             ((unsigned long)__PAGE_OFFSET) 
        #define __pa(x)                 ((unsigned long)(x)-PAGE_OFFSET) 
        #define __va(x)                 ((void *)((unsigned long)(x)+PAGE_OFFSET)) 
    对于内核空间而言,给定一个虚地址 x ,其物理地址为“ x- PAGE_OFFSET” ,给定一个物理地址 x ,其虚地址为“ x+ PAGE_OFFSET ”。
    这里再次说明,宏 __pa() 仅仅把一个内核空间的虚地址映射到物理地址,而决不适用于用户空间,用户空间的地址映射要复杂得多,它通过分页机制完成。
 
图1  从PAGE_OFFSET开始的1GB地址空间 
    先说明图中符号的含义:
        PAGE_OFFSET:0XC0000000,即3GB
        high_memory:这个变量的字面含义是高端内存,到底什么是高端内存,Linux内核规定,RAM的前896为所谓的低端内存,而896~1GB共128MB为高端内存。如果你的内存是512M,那么high_memory是多少?是3GB+512,也就是说,物理地址x
    在源代码中函数mem_init中,有这样一行:
        high_memory = (void *) __va(max_low_pfn * PAGE_SIZE);
    其中,max_low_pfn为物理内存的最大页数。
    所以在图中,PAGE_OFFSET到high_memory 之间就是所谓的物理内存映射。只有这一段之间,物理地址与虚地址之间是简单的线性关系。
    还要说明的是,要在这段内存分配内存,则调用kmalloc()函数。反过来说,通过kmalloc()分配的内存,其物理页是连续的。
        VMALLOC_START:非连续区的的起始地址。
        VMALLOC_END:非连续区的的末尾地址
    在非连续区中,物理内存映射的末端与第一个VMalloc之间有一个8MB的安全区,目的是为了“捕获”对内存的越界访问。处于同样的理由,插入其他4KB的安全区来隔离非连续区。
 
非连续区的分配调用VMalloc()函数。
    vmalloc()与 kmalloc()都是在内核代码中用来分配内存的函数,但二者有何区别?
    从前面的介绍已经看出,这两个函数所分配的内存都处于内核空间,即从3GB~4GB;但位置不同,kmalloc()分配的内存处于3GB~high_memory之间,这一段内核空间与物理内存的映射一一对应,而vmalloc()分配的内存在VMALLOC_START~4GB之间,这一段非连续内存区映射到物理内存也可能是非连续的。
    vmalloc()工作方式与kmalloc()类似, 其主要差别在于前者分配的物理地址无需连续,而后者确保页在物理上是连续的(虚地址自然也是连续的)。
    尽管仅仅在某些情况下才需要物理上连续的内存块,但是,很多内核代码都调用kmalloc(),而不是用vmalloc()获得内存。这主要是出于性能的考虑。vmalloc()函数为了把物理上不连续的页面转换为虚拟地址空间上连续的页,必须专门建立页表项。还有,通过vmalloc()获得的页必须一个一个的进行映射(因为它们物理上不是连续的),这就会导致比直接内存映射大得多的缓冲区刷新。因为这些原因,vmalloc()仅在绝对必要时才会使用——典型的就是为了获得大块内存时,例如,当模块被动态插入到内核中时,就把模块装载到由vmalloc()分配的内存上。
    vmalloc()函数用起来比较简单:
        char *buf;
        buf = vmalloc(16*PAGE_SIZE);  /*获得16页*/
        if (!buf)
        /* 错误!不能分配内存*/
    在使用完分配的内存之后,一定要释放它:
        vfree(buf);
 
阅读(2321) | 评论(1) | 转发(0) |
0

上一篇:库的创建和使用

下一篇:GDB用法详解

给主人留下些什么吧!~~

chinaunix网友2011-08-05 19:20:55

培训班学校视频教程资料光盘 货到付款,省心防骗!订货电括:15OO 6565 675 ■●■整形美容整容外科手术医学教学视频光盘 15盘DVD 货到付款★15OO 6565 675 您一个订货电括说明地址姓名,我们免费送货到你家时再付款。 中美韩国压缩影音资料 适合整形美容外科的医生 包括面部 乳房头整形 隆缩乳 吸脂 隆鼻 牙 眼睑眼袋 耳 颌 腿 臀 腹 阴部 处女膜 植发等很全面 ★ 国外部分手术视频光盘特点: 1. 先进材料得到淋漓尽致地发挥,尤其,近年来国外一些新兴材料的应用,某种程度上使整形手术趋于简单化,本光盘重点表现在面部提升,乳房整形。 2. 先进手术方式、技术难能可贵,本光盘中大量鼻部整形运用了很多较为前卫的手术方法,比如巨乳缩小的术前设计与术中方案、鼻头整形中的耳软骨及颞浅筋模的应用,鼻中隔手术中处理方法等等,是任何国内手术光盘无法比拟的。 3. 手术近距离的拍摄是的手术野清晰可见. 哪里能买到 哪里有 请问 哪里能 买到 可以 下载 免费 赠送 地址 怎样 便宜的 如何 才能 怎么 视频 光