Chinaunix首页 | 论坛 | 博客
  • 博客访问: 469011
  • 博文数量: 83
  • 博客积分: 92
  • 博客等级: 民兵
  • 技术积分: 690
  • 用 户 组: 普通用户
  • 注册时间: 2011-02-25 13:33
文章分类

全部博文(83)

文章存档

2014年(3)

2013年(59)

2012年(16)

2011年(5)

我的朋友

分类:

2012-05-19 11:34:01

原文地址:MMU的使用:地址映射 作者:liushbin

写在前面:因这个问题自己觉得比较难点,用了较多的篇幅来说明,自己在这问题上花的时间也多些
1
(1)cpu核发出VA
(2)VA转换成MVA,cache、MMU使用MVA
  VA->MVA的方法(硬件自动完成):
  if(VA<32M)
   MVA=VA|(PID<<25) //PID通过读CP15的C13获得
  else
 MVA=PA
2
(1)一级页表中的描述符
     1)段描述符(描述符最低两位为10):保存段的起始物理地址
     位[31:20]为段基址,低20位为0就是一块1MB的物理地址空间的起始地址;MVA[19:0]用来在这1MB空间寻址
     2)粗页表描述符(描述符最低两位为01):保存二级页表粗页表的起始物理地址
     它的[31:10]为粗页表基址,低10位为0就是一个二级页表的物理地址。粗页表含256个条目,每个条目大小为4个字节,所以粗页表大小为1KB,每个条目对应大小为4KB的物理空间,256*4KB=1MB,符合一级页表描述符每个对应1MB的物理空间的标准
     3)细页表描述符(描述符最低两位为11):保存二级页表细页表的起始物理地址
      它的[31:12]为细页表基址,低12位为0就是一个二级页表的物理地址。细页表含1024个条目,每个条目大小为4个字节,所以细页表大小为4KB,每个条目对应大小为1KB的物理空间,1024*4KB=1MB,符合一级页表描述符每个对应1MB的物理空间的标准
(2)二级页表中的描述符
     1)大页描述符(描述符最低两位为01):保存大页的起始物理地址
     它的[31:16]为细页表基址,低16位为0就是64KB物理地址空间的起始地址。粗页表中每个条目只能表示4KB的物理空间,如果大页描述符保存在粗页表中,则连续16个条目都保存同一大页描述符;细页表中每个条目只能表示1KB的物理空间,如果大页描述符保存在细页表中,则连续64个条目都保存同一大页描述符
     2)小页描述符(描述符最低两位为10):保存小页的起始物理地址
      它的[31:12]为细页表基址,低12位为0就是4KB物理地址空间的起始地址。粗页表中每个条目只能表示4KB的物理空间,如果小页描述符保存在粗页表中,则1个条目都保存1个小页描述符;细页表中每个条目只能表示1KB的物理空间,如果大页描述符保存在细页表中,则连续4个条目都保存同一大页描述符
     3)极小页描述符:保存极小页的起始物理地址
     它的[31:10]为细页表基址,低10位为0就是1KB物理地址空间的起始地址。极小页描述符只能保存在细页表中,细页表中每个条目只能表示1KB的物理空间,极小页描述符保存在细页表中,则连续1个条目都保存一个极小页描述符
3 一级页表中使用4096个描述符,每个描述符对应1MB的虚拟地址,要么存储了它对应的1MB的物理地址空间,要么存储了下一级页表的地址。一级页表大小为4096*4=16KB
4 使用MVA[31:20]来索引一级页表,得到一个描述符,每个描述符占据4个字节,所以一个一级页表大小为16KB
4 地址转换过程
  (1)寻址段的过程
      页表基址寄存器[31:14]+MVA[31:20]->段描述符
      段描述符[31:20]+MVA[19:0]->PA
  (2)寻址大页的过程(大页描述符保存在粗页表中,保存在细页表中类似)
      页表基址寄存器[31:14]+MVA[31:20]->粗页表描述符
      粗页表描述符[31:10}+MVA[19:12]->大页描述符
      大页描述符[31:16]+MVA[15:0]->PA
 (3)寻址小页的过程(小页描述符保存在粗页表中,保存在细页表中类似)
      页表基址寄存器[31:14]+MVA[31:20]->粗页表描述符
      粗页表描述符[31:10}+MVA[19:12]->小页描述符
      小页描述符[31:12]+MVA[11:0]->PA
 (4)寻址极小页的过程(极小页描述符只能保存在细页表中)
     页表基址寄存器[31:14]+MVA[31:20]->细页表描述符
     细页表描述符[31:12}+MVA[19:10]->极小页描述符
     极小页描述符[31:10]+MVA[9:0]->PA
5 内存访问权限检查
(1)一级页表描述符[5:8]即Domain找CP15寄存器C3中16位中的两位
(2)这两位为11时
    1)段:用用一级描述符中的[10:11]即AP位来检查,控制整个段1MB
    2)大页/小页:用二级页表中的[4:11]即ap0(检查小页/大页低端1KB/16KB)、ap1(……)、ap2(……)、ap3(检查小页/大页高端1KB/16KB)
    3)极小页[4:5]即ap,制整个极小页1KB
6 Cache
 (1)往Icr位即CP15协处理器中寄存器1的第12位写1可以启动ICaches,写0可以停止ICaches;
ICaches一般在MMU开启之后才被使用,此时页表中描述符的C位(称为Ctt)即第三位用来表示一段内存是否可以被Cache;1:可以,0:不可以
(2)往Ccr位即CP15协处理器中寄存器1的第2位写1可以启动DCaches,写0可以停止DCaches;
DCaches必须在MMU开启之后才被使用
7 MMU使用实验:地址映射
(1)分析
1) SDAM地址范围:0x30000000-0x33FFFFFF
   寄存器地址范围:0x48000000-0x5FFFFFFF
2)驱动4个LED的相关寄存器:
   GPBCON:0x56000010
   GPBDAT:0x56000014
3)虚拟地址x0A0000000-0xA01000000映射到物理地址0x56000000-0x56100000
  这样就可以通过操作地址0xA0000010、0xA0000014来达到驱动这4个LED的同样效果
4)使用一级页表,占16KB,存放到SDRAM的开始16KB,所以剩下的内存开始物理地址为0x30004000
5)将虚拟地址xB00000000-0xB3FFFFFF映射到物理地址0x30000000-0x33FFFFFF,并在连接程序时将一部分代码的运行地址指定为0xB0004000,看看能否令程序跳转到0xB0004000
(2)head.S
@*************************************************************************
@ File:head.S
@ 功能:设置SDRAM,将第二部分代码复制到SDRAM,设置页表,启动MMU,
@       然后跳到SDRAM继续执行
@*************************************************************************      
.text
.global _start
_start:
    ldr sp, =4096                       @ 设置栈指针,以下都是C函数,调用前需要设好栈
    bl  disable_watch_dog               @ 关闭WATCHDOG,否则CPU会不断重启
    bl  memsetup                        @ 设置存储控制器以使用SDRAM
    bl  copy_2th_to_sdram               @ 将第二部分代码复制到SDRAM
    bl  create_page_table               @ 设置页表
    bl  mmu_init                        @ 启动MMU
    ldr sp, =0xB4000000                 @ 重设栈指针,指向SDRAM顶端(使用虚拟地址)
    ldr pc, =0xB0004000                 @ 跳到SDRAM中继续执行第二部分代码
halt_loop:
    b   halt_loop
(3)init.c
 1)/*
 * init.c: 进行一些初始化,在Steppingstone中运行
 * 它和head.S同属第一部分程序,此时MMU未开启,使用物理地址
 */
/* WATCHDOG寄存器 */
#define WTCON           (*(volatile unsigned long *)0x53000000)
/* 存储控制器的寄存器起始地址 */
#define MEM_CTL_BASE    0x48000000

/*
 * 关闭WATCHDOG,否则CPU会不断重启
 */
void disable_watch_dog(void)
{
    WTCON = 0;  // 关闭WATCHDOG很简单,往这个寄存器写0即可
}
/*
 * 设置存储控制器以使用SDRAM
 */
void memsetup(void)
{
    /* SDRAM 13个寄存器的值 */
    unsigned long  const    mem_cfg_val[]={ 0x22011110,     //BWSCON
                                            0x00000700,     //BANKCON0
                                            0x00000700,     //BANKCON1
                                            0x00000700,     //BANKCON2
                                            0x00000700,     //BANKCON3 
                                            0x00000700,     //BANKCON4
                                            0x00000700,     //BANKCON5
                                            0x00018005,     //BANKCON6
                                            0x00018005,     //BANKCON7
                                            0x008C07A3,     //REFRESH
                                            0x000000B1,     //BANKSIZE
                                            0x00000030,     //MRSRB6
                                            0x00000030,     //MRSRB7
                                    };
    int     i = 0;
    volatile unsigned long *p = (volatile unsigned long *)MEM_CTL_BASE;
    for(; i < 13; i++)
        p[i] = mem_cfg_val[i];
}
/*
 * 将第二部分代码复制到SDRAM
 */
void copy_2th_to_sdram(void)
{
    unsigned int *pdwSrc  = (unsigned int *)2048;
    unsigned int *pdwDest = (unsigned int *)0x30004000;
   
    while (pdwSrc < (unsigned int *)4096)
    {
        *pdwDest = *pdwSrc;
        pdwDest++;
        pdwSrc++;
    }
}
2)/*
 * 将第二部分代码复制到SDRAM
 */
void copy_2th_to_sdram(void)
{
    unsigned int *pdwSrc  = (unsigned int *)2048;
    unsigned int *pdwDest = (unsigned int *)0x30004000;
   
    while (pdwSrc < (unsigned int *)4096)
    {
        *pdwDest = *pdwSrc;
        pdwDest++;
        pdwSrc++;
    }
}
3)/*
 * 设置页表
 */
void create_page_table(void)
{
/*
 * 用于段描述符的一些宏定义
 */
#define MMU_FULL_ACCESS     (3 << 10)   /* 访问权限 */
#define MMU_DOMAIN          (0 << 5)    /* 属于哪个域 */
#define MMU_SPECIAL         (1 << 4)    /* 必须是1 */
#define MMU_CACHEABLE       (1 << 3)    /* cacheable */
#define MMU_BUFFERABLE      (1 << 2)    /* bufferable */
#define MMU_SECTION         (2)         /* 表示这是段描述符 */
#define MMU_SECDESC         (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \
                             MMU_SECTION)
#define MMU_SECDESC_WB      (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \
                             MMU_CACHEABLE | MMU_BUFFERABLE | MMU_SECTION)
#define MMU_SECTION_SIZE    0x00100000
    unsigned long virtuladdr, physicaladdr;
    unsigned long *mmu_tlb_base = (unsigned long *)0x30000000;
   
    /*
     * Steppingstone的起始物理地址为0,第一部分程序的起始运行地址也是0,
     * 为了在开启MMU后仍能运行第一部分的程序,
     * 将0~1M的虚拟地址映射到同样的物理地址
     */
    virtuladdr = 0;
    physicaladdr = 0;
    *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
                                            MMU_SECDESC_WB;
    /*
     * 0x56000000是GPIO寄存器的起始物理地址,
     * GPBCON和GPBDAT这两个寄存器的物理地址0x56000010、0x56000014,
     * 为了在第二部分程序中能以地址0xA0000010、0xA0000014来操作GPBCON、GPBDAT,
     * 把从0xA0000000开始的1M虚拟地址空间映射到从0x56000000开始的1M物理地址空间
     */
    virtuladdr = 0xA0000000;
    physicaladdr = 0x56000000;
    *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
                                            MMU_SECDESC;
    /*
     * SDRAM的物理地址范围是0x30000000~0x33FFFFFF,
     * 将虚拟地址0xB0000000~0xB3FFFFFF映射到物理地址0x30000000~0x33FFFFFF上,
     * 总共64M,涉及64个段描述符
     */
    virtuladdr = 0xB0000000;
    physicaladdr = 0x30000000;
    while (virtuladdr < 0xB4000000)
    {
        *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
                                                MMU_SECDESC_WB;
        virtuladdr += 0x100000;
        physicaladdr += 0x100000;
    }
}
4)这部分代码我觉得很有参考价值
/*
 * 启动MMU
 */
void mmu_init(void)
{
    unsigned long ttb = 0x30000000;
__asm__(
    "mov    r0, #0\n"
    "mcr    p15, 0, r0, c7, c7, 0\n"    /* 使无效ICaches和DCaches */
   
    "mcr    p15, 0, r0, c7, c10, 4\n"   /* drain write buffer on v4 */
    "mcr    p15, 0, r0, c8, c7, 0\n"    /* 使无效指令、数据TLB */
   
    "mov    r4, %0\n"                   /* r4 = 页表基址 */
    /*
     C中嵌入汇编的格式
     __asm__(code list:output:Input:Modify)
     %0为操作数占位符,与输入变量ttb对应。
    */
    "mcr    p15, 0, r4, c2, c0, 0\n"    /* 设置页表基址寄存器 */
   
    "mvn    r0, #0\n"                  
    "mcr    p15, 0, r0, c3, c0, 0\n"    /* 域访问控制寄存器设为0xFFFFFFFF,
                                         * 不进行权限检查
                                         */   
    /*
     * 对于控制寄存器,先读出其值,在这基础上修改感兴趣的位,
     * 然后再写入
     */
    "mrc    p15, 0, r0, c1, c0, 0\n"    /* 读出控制寄存器的值 */
   
    /* 控制寄存器的低16位含义为:.RVI ..RS B... .CAM
     * R : 表示换出Cache中的条目时使用的算法,
     *     0 = Random replacement;1 = Round robin replacement
     * V : 表示异常向量表所在的位置,
     *     0 = Low addresses = 0x00000000;1 = High addresses = 0xFFFF0000
     * I : 0 = 关闭ICaches;1 = 开启ICaches
     * R、S : 用来与页表中的描述符一起确定内存的访问权限
     * B : 0 = CPU为小字节序;1 = CPU为大字节序
     * C : 0 = 关闭DCaches;1 = 开启DCaches
     * A : 0 = 数据访问时不进行地址对齐检查;1 = 数据访问时进行地址对齐检查
     * M : 0 = 关闭MMU;1 = 开启MMU
     */
   
    /* 
     * 先清除不需要的位,往下若需要则重新设置它们   
     */
                                        /* .RVI ..RS B... .CAM */
    "bic    r0, r0, #0x3000\n"          /* ..11 .... .... .... 清除V、I位 */
    "bic    r0, r0, #0x0300\n"          /* .... ..11 .... .... 清除R、S位 */
    "bic    r0, r0, #0x0087\n"          /* .... .... 1... .111 清除B/C/A/M */
    /*
     * 设置需要的位
     */
    "orr    r0, r0, #0x0002\n"          /* .... .... .... ..1. 开启对齐检查 */
    "orr    r0, r0, #0x0004\n"          /* .... .... .... .1.. 开启DCaches */
    "orr    r0, r0, #0x1000\n"          /* ...1 .... .... .... 开启ICaches */
    "orr    r0, r0, #0x0001\n"          /* .... .... .... ...1 使能MMU */
   
    "mcr    p15, 0, r0, c1, c0, 0\n"    /* 将修改的值写入控制寄存器 */
    : /* 无输出 */
    : "r" (ttb) );
}
5)/*
 * leds.c: 循环点亮4个LED
 * 属于第二部分程序,此时MMU已开启,使用虚拟地址
 */
#define GPBCON      (*(volatile unsigned long *)0xA0000010)     // 物理地址0x56000010
#define GPBDAT      (*(volatile unsigned long *)0xA0000014)     // 物理地址0x56000014
#define GPB5_out    (1<<(5*2))
#define GPB6_out    (1<<(6*2))
#define GPB7_out    (1<<(7*2))
#define GPB8_out    (1<<(8*2))
/*
 * wait函数加上“static inline”是有原因的,
 * 这样可以使得编译leds.c时,wait嵌入main中,编译结果中只有main一个函数。
 * 于是在连接时,main函数的地址就是由连接文件指定的运行时装载地址。
 * 而连接文件mmu.lds中,指定了leds.o的运行时装载地址为0xB4004000,
 * 这样,head.S中的“ldr pc, =0xB4004000”就是跳去执行main函数。
 */
static inline void wait(unsigned long dly)
{
    for(; dly > 0; dly--);
}
int main(void)
{
    unsigned long i = 0;
   
    // 将LED1-4对应的GPB5/6/7/8四个引脚设为输出
    GPBCON = GPB5_out|GPB6_out|GPB7_out|GPB8_out;      
    while(1){
        wait(30000);
        GPBDAT = (~(i<<5));     // 根据i的值,点亮LED1-4
        if(++i == 16)
            i = 0;
    }
    return 0;
}

书上的测试程序在我的mini2440板子上表现为4个LED全亮,并没有像要求的那样显示,个人觉得是速度太快的原因,所以自己写个简单的点灯程序来测试,能达到测试效果:mmu.tar.gz
阅读(1460) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~