内核空间与cpu物理地址转换：依靠MMU-Kernel的makefile-ChinaUnix博客

Kernel的makefile

首页　| 　博文目录　| 　关于我

Kernel的makefile

博客访问： 3266403
博文数量： 685
博客积分： 0
博客等级：民兵
技术积分： 5303
用户组：普通用户
注册时间： 2014-04-19 14:17

个人简介

文章分类

全部博文（685）

Ubuntu12.04小应（4）
语音识别及语音合（3）
Pjsips与mqtt（17）
Linux内存管理子（2）
笔记本内核升级及（5）
Linux内核态进程（14）
Linux内核设计模（1）
Linux开发常用命（22）
Ubuntu常见系统故（19）

init进程_Ubuntu（3）

Grub与wingrub（4）

Ubuntu系统启动（5）
Tools Packa（34）

fstools（2）

内核热插拔事件的（3）

shell相关（2）

json-c0.9库与jso（1）

Tc：traffic-cont（3）

uci（2）

Ctags与Taglist（3）

uhttpd（7）

busybox（0）

netifd（2）

procd（0）

ubus（1）

Uboot（5）
Linux-2014（70）

I2C接口存储芯片(（3）

LED灯添加删除（4）

单板启动重要函数（1）

flash芯片更换（20）

内核重要函数（8）
TMP:boot/busybox（1）
人脸识别openCV（4）
摄像头（2）
openSIPS与流媒体（4）
Samba服务器安装（1）
Web服务器与Cgi/i（7）
Linux内核调试（10）
内核网络编程（18）
shell（1）
Android安卓（45）

Goldfish安卓模拟（4）

Android系统移植（5）

安卓驱动（1）

Android系统集成（7）

Cubietruck（1）

MTK的解决方案（8）

S3c6410（8）
原创--TMP（46）
openWRT（145）

brctl网桥（3）

lua（19）

系统机制（4）

智能路由：必备功（8）

基本路由配置：联（1）

防火墙/DMZ/UPNP（3）

dnsmasq与dnsmasq（1）

linux常用网络命（0）

netifd（1）

netstat（2）

文件系统（9）

应用软件包及内核（5）

系统日志syslogd+（1）

procd+libubox（2）

DHCP移植（1）

Hostapd与wpa移植（5）

Iptables移植（6）

Arm移植wifi驱动（5）

Ifconfig移植：网（2）

Iwpriv移植：Wifi（5）

Web服务器（2）

迅雷（0）

ARM移植openWRT（5）

工具（2）

pppoe拨号上网（2）

刷机（5）

底层驱动（11）

系统编译框架及脚（16）

LuCI（19）
driver（22）
名词概念（7）
Linux（148）

Cfg80211内核（2）

物理地址与虚拟地（1）

按键驱动（1）

Timer定时器（1）

linux_Platform设（1）

linux_tty串口驱（3）

flash驱动（3）

I2c子系统（3）

/sys与/proc（10）

MMU、cache、DDR（3）

Mips裸机（7）

pinctrl（2）

leds子系统（3）

workqueue与taskl（1）

input子系统（3）

内核机制（4）

开源应用工具移植（2）

编译链接vmlinux.（5）

函数解读（7）

内核挂死（3）

DTS设备树（4）

内核调试Kernel&n（3）

内核移植与升级（10）

根文件系统（22）

软件配置及工具链（7）

rootfs与Initramf（4）
Uboot（23）
代码检视&&心得（1）
未分配的博文（9）

文章存档

2015年（116）

2014年（569）

我的朋友

相关博文

内核空间与cpu物理地址转换：依靠MMU

分类： LINUX

2015-01-08 19:33:28

原文地址：
http://www.cnblogs.com/stardream/articles/1758289.html

简单的来说，cp15协处理器的某个寄存器保存了一级页表所存放的实际物理地址，要求16KB对齐，以段的方式映射，4GB的虚拟地址空间，需要段描述符4096个(每个段描述符映射1M空间)，没个描述符占用4byte,所以一段的方式映射一级页表占用的空间为16KB。

在这里我们假设，我们的一级页表存放在物理地址:0x30000000.

第一步:
获得虚拟地址所对应的段描述符所在的地址
addr = TTB&0xffffc000 | ((viraddr >> 20) << 2 ) = 0x30000000 & 0xfffc000 | ((0xa0004000 >> 20) << 2)= 0x30000000 | (0xa00 << 2) = 0x30002800

第二步:
从0x30002800取出虚拟地址所对应的段描述符

段描述的构造我们到后面再来讲解,这里我们假设我们把0xa0004000映射到实际的物理地址0x30004000，则这里的[31:20]为0x300

第三步:
组合成实际的物理地址

phyaddr = 0x300 << 20 | (0xa0004000 & 0xfffff) = 0x30004000

环境及说明：恒颐S3C2410开发板H2410。H2410核心板扩展有64MB的K4S561632 SDRAM(4M*16bit*4BANK)，地址范围是0x30000000~0x33FFFFFF。GPIO端口的地址范围是0x56000000~0X560000B0。

实验思路：开发板上电启动后，自动将NandFlash开始的4K数据复制到SRAM中，然后跳转到0地址开始执行，然后初始化存储控制器SDRAM，把2K后的代码从SRAM中复制到SDRAM中(存放在0x30004000，前16KB用来存放页表)、设置页表、启动MMU实现虚拟地址映射GPIO寄存器和SDRAM，最后跳转到SDRAM中(地址0xB0004000)运行。重新设置栈指针，跳到点灯代码的入口点实现点灯操作。

2.虚拟地址到物理地址的转换过程。ARM使用页表来进行转换，S3C2410最多会用到两级页表，以段(Section，1M)的方式进行转换时只用到一级页表，以页(Page)的方式进行转换时用到两级页表。页的大小有3种：大页(64KB)、小页(4KB)和极小页(1KB)。本文只是以段地址转换过程为例来讲解一下，页的转换大同小异。
★首先有个页表基址寄存器(位置为协处理器CP15的寄存器C2)，它里面写入的就是一级页表的地址，通过读取它就可以找到一级页表存放的起始位置。一级页表的地址是16K对齐(所以[13:0]为0，使用[31:14]存储页表基址)。一级页表使用4096个描述符来表示4GB空间，所以每个描述符对应1MB的虚拟地址，存储它对应的1MB物理空间的起始地址，或者存储下一级页表的地址。使用MVA[31:20]来索引一级页表(31-20一共12位，2^12=4096，所以是4096个描述符)，得到一个描述符，每个描述符占4个字节。
★描述符最后两位为0B10时，即是段的方式映射。[31:20]为段基址，此描述符低20位填充0后就是一块1MB物理地址空间的起始地址。MVA[19:0]用来在这1MB空间中寻址。描述符的位[31:20]和MVA[19:0]构成了这个虚拟地址MVA对应的物理地址。以段的方式进行映射时，虚拟地址MVA到物理地址PA的转换过程如下：①页表基址寄存器位[31:14]和MVA[31:20]组成一个低两位为0的32位地址，MMU利用这个地址找到段描述符；②取出段描述符的位[31:20](段基址)，它和MVA[19:0]组成一个32位的物理地址(这就是MVA对应的PA)。

二、内存的访问权限检查
内存的访问权限检查决定一块内存是否允许读/写。这由CP15寄存器C3(域访问控制)、描述符的域(Domain)、CP15寄存器C1的R/S/A位和描述符的AP位共同决定。“域”决定是否对某块内存进行权限检查，"AP"决定如何对某块内容进行权限检查。S3C2440有16个域，CP15寄存器C3中每两位对应一个域(一共32位)，用来表示这个域是否进行权限检查。
每两位数据的含义：00---无访问权限(任何访问都将导致"Domain fault"异常)；01---客户模式(使用段描述符、页描述符进行权限检查)；10---保留(保留，目前相当于“无访问权限”)；11---管理模式(不进行权限检查，允许任何访问)。"Domain"占用4位，用来表示内存属于0-15哪一个域。
三、TLB和Cache
首先说两者都是利用程序访问的局部性原理，通过设置高速、小容量的存储器来提高性能。
1.(TLB---Translation Lookaside Buffers，转译查找缓存):由于从MVA到PA的转换需要访问多次内存，大大降低了CPU的性能，故提出TLB办法改进。当CPU发出一个虚拟地址时，MMU首先访问TLB。如果TLB中含有能转换这个虚拟地址的描述符，则直接利用此描述符进行地址转换和权限检查，否则MMU访问页表找到描述符后再进行地址转换和权限检查，并将这个描述符填入TLB中，下次再使用这个虚拟地址时就直接使用TLB用的描述符。使用TLB需要保证TLB中的内容与页表一致，在启动MMU之前，页表中的内容发生变化后，尤其要注意。一般的做法是在启动MMU之前使整个TLB无效，改变页表时，使所涉及的虚拟地址对应的TLB中条目无效。
2.(Cache，高速缓存)：为提高程序的运行速度，在主存和CPU通用寄存器之间设置一个高速的、容量相对较小的存储器，把正在执行的指令地址附近的一部分指令或数据从主存调入这个存储器，供CPU在一段时间内使用。
★写数据的两种方式：①(Write Through，写穿式)---任一CPU发出写信号送到Cache的同时，也写入主存，保证主存的数据同步更新。优点是操作简单，但由于主存速度慢，降低了系统的写速度并占用了总线的时间。②(Write Back，回写式)---数据一般只写到Cache，这样可能出现Cache中的数据得到更新而主存中的数据不变(数据陈旧)的情况。此时可在Cache中设一个标志地址及数据陈旧的信息，只有当Cache中的数据被换出或强制进行”清空“操作时，才将原更新的数据写入主存响应的单元中，保证了Cache和主存中数据一致。
★Cache有以下两个操作：①(Clean，清空)---把Cache或Write buffer中已经脏的(修改过，但未写入主存)数据写入主存。②(Invalidate，使无效)---使之不能再使用，并不将脏的数据写入主存。
★S2C2440内置了(ICaches，指令Cache)、(DCaches，数据Cache)和(Write buffer，写缓存)，操作时需要用到描述符中的C位(Ctt)和B位(Btt)。①(ICaches，指令Cache)---系统刚上电或复位时，ICaches中的内容是无效的，并且ICaches功能关闭。往Icr位(CP15协处理器中寄存器1的第12位)写1可以启动ICaches，写0停止ICaches。ICaches一般在MMU开启后使用，此时描述符的C位用来表示一段内存是否可以被Cache。若Ctt=1，允许Cache，否则不允许。如果MMU没有开启，ICaches也可以被使用，此时CPU读取指令时所涉及的内存都被当做允许Cache。ICaches关闭时，CPU每次取指都要读取主存，性能低，所以通常尽早启动ICaches。ICaches开启后，CPU每次取指时都会先在ICaches中查看是否能找到所用指令，而不管Ctt是0还是1。如果找到成为Cache命中，找不到称为Cache丢失，ICaches被开启后，CPU的取指有如下三种情况：Cache命中且Ctt为1时，从ICaches中取指，返回CPU；Cache丢失且Ctt为1时，CPU从主存中取指，并且把指令缓存到Cache中；Ctt为0时，CPU从主存中取指。②(DCaches，数据Cache)---与ICaches相似，系统刚上电或复位时，DCaches中的内容无效，并且DCaches功能关闭，Write buffer中的内容也是被废弃不用的。往Ccr位(CP15协处理器中寄存器1的第二位)写1启动DCaches，写0停止DCaches。Write buffer和DCaches紧密结合，额米有专门的控制来开启和停止它。与ICaches不同，DCaches功能必须在MMU开启之后才能被使用。DCaches被关闭时，CPU每次都去内存取数据。DCaches被开启后，CPU每次读写数据时都会先在DCaches中查看是否能找到所要的数据，不管Ctt是0还是1，找到了称为Cache命中，找不到称为Cache丢失。
★使用Cache时需要保证Cache、Write buffer的内容和主存内容一致，保证下面两个原则：①清空DCaches，使主存数据得到更新。②使无效ICaches，使CPU取指时重新读取主存。
在实际编写程序时，要注意如下几点：①开启MMU前，使无效ICaches，DCaches和Write buffer。②关闭MMU前，清空ICaches、DCaches，即将“脏”数据写到主存上。③如果代码有变，使无效ICaches，这样CPU取指时会从新读取主存。④使用DMA操作可以被Cache的内存时：将内存的数据发送出去时，要清空Cache；将内存的数据读入时，要使无效Cache。⑤改变页表中地址映射关系时也要慎重考虑。⑥开启ICaches或DCaches时，要考虑ICaches或DCaches中的内容是否与主存保持一致。⑦对于I/O地址空间，不使用Cache和Write buffer。
四、MMU、TLB及Cache的控制指令
S3C2410除了ARM920T的CPU核心外，还有若干个协处理器，用来帮助主CPU完成一些特殊功能，对MMU、TLB及Cache等的操作就涉及到协处理器。格式如下：
{条件} 协处理器编码，协处理器操作码1，目的寄存器，源寄存器1，源寄存器2，协处理器操作码2
{cond} p#,,Rd,cn,cm{,}
MRC  //从协处理器获得数据，传给ARM920T CPU核心寄存器
MCR  //数据从ARM920T CPU核心寄存器传给协处理器
{cond}  //执行条件，省略时表示无条件执行
p#  //协处理器序号
  //一个常数
Rd  //ARM920T CPU核心的寄存器
cn和cm  //协处理器中的寄存器
  //一个常数
其中，、cn、cm、仅供协处理器使用，它们的作用如何取决于具体的协处理器。

示例代码解析：
开启MMU，并将虚拟地址0xA0000000~0xA0100000映射到物理地址0x56000000~0x56100000(GPFCON物理地址为0x56000050，GPFDAT物理地址为0x56000054)；将虚拟地址0xB0000000~0xB3FFFFFF映射到物理地址0x30000000~0x33FFFFFF。本示例以段的方式进行地址映射，只使用一级页表，通过上面内容可知一级页表使用4096个描述符来表示4G空间(每个描述符对应1MB)，每个描述符占4字节，所以一级页表占16KB。使用SDRAM的开始16KB存放一级页表，所以剩下的内存开始地址就为0x30004000，这个地址最终会对应虚拟地址0xB0004000(所以代码运行地址为0xB0004000)。
★程序执行主要流程的示例代码。
.text
.global _start
_start:
    bl  disable_watch_dog                   @ 关闭WATCHDOG，否则CPU会不断重启
    bl  mem_control_setup                  @ 设置存储控制器以使用SDRAM
    ldr sp, =4096                                    @ 设置栈指针，以下是C函数调用前需要设好栈
    bl  copy_2th_to_sdram                   @ 将第二部分代码复制到SDRAM
    bl  create_page_table                     @ 设置页表
    bl  mmu_init                                      @ 启动MMU，启动以后下面代码都用虚拟地址
    ldr sp, =0xB4000000                       @ 重设栈指针，指向SDRAM顶端(使用虚拟地址)
    ldr pc, =0xB0004000                        @ 跳到SDRAM中继续执行第二部分代码
halt_loop:
    b   halt_loop
★设置页表。
void create_page_table(void)
{

/*
* 用于段描述符的一些宏定义：[31:20]段基址，[11:10]AP，[8:5]Domain，[3]C，[2]B，[1:0]0b10为段描述符
*/
#define MMU_FULL_ACCESS     (3 << 10)   /* 访问权限AP */
#define MMU_DOMAIN          (0 << 5)    /* 属于哪个域 Domain*/
#define MMU_SPECIAL         (1 << 4)    /* 必须是1 */
#define MMU_CACHEABLE       (1 << 3)    /* cacheable C位*/
#define MMU_BUFFERABLE      (1 << 2)    /* bufferable B位*/
#define MMU_SECTION         (2)         /* 表示这是段描述符 */
#define MMU_SECDESC         (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | MMU_SECTION)
#define MMU_SECDESC_WB      (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | MMU_CACHEABLE | MMU_BUFFERABLE | MMU_SECTION)
#define MMU_SECTION_SIZE    0x00100000        /*每个段描述符对应1MB大小空间*/

    unsigned long virtuladdr, physicaladdr;
    unsigned long *mmu_tlb_base = (unsigned long *)0x30000000;        /*SDRAM开始地址存放页表*/

    /*
     * Steppingstone的起始物理地址为0，第一部分程序的起始运行地址也是0，为了在开启MMU后仍能运行第一部分的程序，将0～1M的虚拟地址映射到同样的物理地址
     */
    virtuladdr = 0;
    physicaladdr = 0;
    /*虚拟地址[31:20]用于索引一级页表，找到它对应的描述符，对应于(virtualaddr>>20)。段描述符中[31:20]保存段的物理地址，对应(physicaladdr & 0xFFF00000)*/
    *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | MMU_SECDESC_WB;

    /*
     * 0x56000000是GPIO寄存器的起始物理地址，GPBCON和GPBDAT这两个寄存器的物理地址0x56000010、0x56000014，为了在第二部分程序中能以地址0xA0000010、0xA0000014来操作GPBCON、GPBDAT，
     * 把从0xA0000000开始的1M虚拟地址空间映射到从0x56000000开始的1M物理地址空间
     */
    virtuladdr = 0xA0000000;
    physicaladdr = 0x56000000;
    *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | MMU_SECDESC;

    /*
     * SDRAM的物理地址范围是0x30000000～0x33FFFFFF，将虚拟地址0xB0000000～0xB3FFFFFF映射到物理地址0x30000000～0x33FFFFFF上，总共64M，涉及64个段描述符
     */
    virtuladdr = 0xB0000000;
    physicaladdr = 0x30000000;
    while (virtuladdr < 0xB4000000)
    {
        *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | MMU_SECDESC_WB;
        virtuladdr += MMU_SECTION_SIZE;
        physicaladdr += MMU_SECTION_SIZE;
    }
}
★ 启动MMU。
void mmu_init(void)
{
    unsigned long ttb = 0x30000000;

__asm__(
    "mov    r0, #0\n"
    "mcr    p15, 0, r0, c7, c7, 0\n"    /* 使无效ICaches和DCaches */

    "mcr    p15, 0, r0, c7, c10, 4\n"   /* drain write buffer on v4 */
    "mcr    p15, 0, r0, c8, c7, 0\n"    /* 使无效指令、数据TLB */

    "mov    r4, %0\n"                   /* r4 = 页表基址 */
    "mcr    p15, 0, r4, c2, c0, 0\n"    /* 设置页表基址寄存器 */

    "mvn    r0, #0\n"
    "mcr    p15, 0, r0, c3, c0, 0\n"    /* 域访问控制寄存器设为0xFFFFFFFF，不进行权限检查*/
    /*
     * 对于控制寄存器，先读出其值，在这基础上修改感兴趣的位，然后再写入
     */
    "mrc    p15, 0, r0, c1, c0, 0\n"    /* 读出控制寄存器的值 */

    /* 控制寄存器的低16位含义为：.RVI ..RS B... .CAM
     * R : 表示换出Cache中的条目时使用的算法，0 = Random replacement；1 = Round robin replacement
     * V : 表示异常向量表所在的位置，0 = Low addresses = 0x00000000；1 = High addresses = 0xFFFF0000
     * I : 0 = 关闭ICaches；1 = 开启ICaches
     * R、S : 用来与页表中的描述符一起确定内存的访问权限
     * B : 0 = CPU为小字节序；1 = CPU为大字节序
     * C : 0 = 关闭DCaches；1 = 开启DCaches
     * A : 0 = 数据访问时不进行地址对齐检查；1 = 数据访问时进行地址对齐检查
     * M : 0 = 关闭MMU；1 = 开启MMU
     */

    /*
     * 先清除不需要的位，往下若需要则重新设置它们
     */
                                        /* .RVI ..RS B... .CAM */
    "bic    r0, r0, #0x3000\n"          /* ..11 .... .... .... 清除V、I位 */
    "bic    r0, r0, #0x0300\n"          /* .... ..11 .... .... 清除R、S位 */
    "bic    r0, r0, #0x0087\n"          /* .... .... 1... .111 清除B/C/A/M */

    /*
     * 设置需要的位
     */
    "orr    r0, r0, #0x0002\n"          /* .... .... .... ..1. 开启对齐检查 */
    "orr    r0, r0, #0x0004\n"          /* .... .... .... .1.. 开启DCaches */
    "orr    r0, r0, #0x1000\n"          /* ...1 .... .... .... 开启ICaches */
    "orr    r0, r0, #0x0001\n"          /* .... .... .... ...1 使能MMU */

    "mcr    p15, 0, r0, c1, c0, 0\n"    /* 将修改的值写入控制寄存器 */
    : /* 无输出 */
    : "r" (ttb) );
}

阅读(2443) | 评论(0) | 转发(0) |

上一篇：内存管理伙伴系统分析

下一篇：Linux ALSA声卡驱动之一：ALSA架构简介

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6