Chinaunix首页 | 论坛 | 博客
  • 博客访问: 352530
  • 博文数量: 41
  • 博客积分: 2010
  • 博客等级: 大尉
  • 技术积分: 784
  • 用 户 组: 普通用户
  • 注册时间: 2008-06-21 20:58
文章分类

全部博文(41)

文章存档

2017年(1)

2010年(1)

2009年(18)

2008年(21)

分类: LINUX

2008-12-14 13:09:57

在了解了ARM相关的汇编指令后,同时结合网上各位大虾的提点开始阅读u-boot的启动代码,现将分析过程记录如下



可执行文件及内存映射
我们可以把可执行文件分为2种情况:存放态和运行态
1.存放态:可执行文件经过烧到存储介质上(flash或磁盘)的分布,此时可执行文件通常有2部分组成,代码段和数据段,代码段又分为可执行代码段(.text)和只读数据段(.rodata),数据段可以分为初始化数据段(.data)和未初始化代码段(.bss),如下:

+-------------+-----------
| .bss        |   (ZI)
+-------------+-- 数据段
| .data       |   (RW)
+-------------+-----------
| .rodata     |
|_____________| 代码段(RO)
| .text       |
+-------------+-----------

2.运行态:可执行文件经过装载后就变成为运行态,
当可执行文件装载后, 在RAM中的分布如下:
| ...         |
+-------------+-- ZI段结束地址
| ZI 段       |
+-------------+-- ZI段起始地址
| 保留区2     |
+-------------+-- RW段结束地址
| RW 段       |
+-------------+-- RW段起始地址
| 保留区1     |
+-------------+-- RO段结束地址
| RO 段       |
+-------------+-- RO段起始地址

所以装载过程必须完成把可执行文件的各个段搬移到RAM的指定位置,这个装载过程则是由启动程序来完成的。而可执行代码在RAM中的地址则是由链接脚本来指定的。



一个可执行的image必须有一个入口点,并且只能有一个全局入口点,所以要通知编译器这个入口在哪里。这个是有链接脚本来实现的,由此我们可以找到程序的入口点是在 /board/lpc2210/u-boot.lds中指定的,其中ENTRY(_start)说明程序从_start开始运行,而他指向的是cpu /arm7tdmi/start.o文件。因为我们用的是ARM7TDMI的cpu架构,在复位后从地址0x00000000取它的第一条指令,所以我们将Flash映射到这个地址上,这样在系统加电后,cpu将首先执行u-boot程序。


ARM在CPU加电复位后是从0x0000地址开始取指,因此在零地址需要放置第一条启动代码。默认情况下,程序的链接器是把0x8000作为映像的入口点(取指的第一条指令的位置),因此 需要对映像链接定位,即重定位映像段的存放,包括代码段、数据段、零区等,对整个系统的代码做正确的定位,这些规则通常写成链接脚本。链接脚本就是提供了一种把代码段和数据段放在不同存储器定位。

我们的只读代码和数据是固化在ROM中(通常在0x0000),但是在执行的时候想在RAM区运行(优化系统,使性能发挥最大),就需要链接定位。链接器告诉了随机存储器从哪里开始。


Load View:代码编译链接的一个组织情况
Execute View:代码正确执行的空间组织


启动过程的C部分
1. 初始化MMU
2.初始化外部端口
3. 中断处理程序表初始化
4. 串口初始化
5. 其它部分初始化(可选)
6. 主程序循环

于是我们可以在链接脚本中找到映像的加载地址,也即程序的入口点。/board/s3c2410/U-boot.lds

OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm")
/*OUTPUT_FORMAT("elf32-arm", "elf32-arm", "elf32-arm")*/
OUTPUT_ARCH(arm)
ENTRY(_start)
SECTIONS
{
    . = 0x00000000; /*映像的入口点,通常链接器将此地址定位到ROM的0x0地址,必须使编译器知道这 
                                    个地址*/
    . = ALIGN(4);
    .text      :
    {
      cpu/arm920t/start.o    (.text)
      *(.text)
    }

    . = ALIGN(4);
    .rodata : { *(.rodata) }

    . = ALIGN(4);
    .data : { *(.data) }

    . = ALIGN(4);
    .got : { *(.got) }

    . = .;
    __u_boot_cmd_start = .;
    .u_boot_cmd : { *(.u_boot_cmd) }
    __u_boot_cmd_end = .;

    . = ALIGN(4);
    __bss_start = .;
    .bss : { *(.bss) }
    _end = .;
}
从上面可以看出,链接脚本指定了代码段从0x00000000开始,而代码段最开始链接的就是cpu/arm920t/start.o。于是可以知道在CPU加电复位后程序首先是从cpu/arm920t/start.S开始的。

1.Stage1:cpu/arm920t/start.S
当系统启动时, ARM CPU会跳到0x00000000去执行。一般BootLoader都包括如下几个部分:
1. 建立中断向量异常表
2. 显示的切换到SVC且32指令模式
3. 关闭S3C2410的内部看门狗
4. 禁止所有的中断
5. 配置系统时钟频率和总线频率
6. 设置内存区的控制寄存器
7. 初始化中断
8. 安装中断向表量
9. 把可执行文件的各个段搬到运行态的各个位置
10. 跳到C代码部分执行

具体分析如下:


/*复位时0地址是ROM区,从0x0到0x20分配了ARM的中断向量表*/
.globl _start
_start:    b       reset  /*0x0,正常情况下,系统reset后进入的入口,驻留于0x0地址,机器码为EA0000XX*/
    ldr    pc, _undefined_instruction /*0x4,未定义指令,系统出错处理的入口*/
    ldr    pc, _software_interrupt /*0x8,软中断,monitor程序的入口*/
    ldr    pc, _prefetch_abort   /*0x0c,预取失败错误*/
    ldr    pc, _data_abort       /*0x10,取数据失败错误(通常是保护现场,然后do nothing)*/
    ldr    pc, _not_used        /*0x14保留*/
    ldr    pc, _irq             /*0x18,快速中断请求 */
    ldr    pc, _fiq             /*0x1c,处理原理与irq相同,所有的硬件中断源共用一个通道来进行IRQ或FIQ */

_undefined_instruction:    .word undefined_instruction
_software_interrupt:    .word software_interrupt
_prefetch_abort:    .word prefetch_abort
_data_abort:        .word data_abort
_not_used:        .word not_used
_irq:            .word irq
_fiq:            .word fiq

    .balignl 16,0xdeadbeef
/*.将地址对其到16的倍数,如果PC跳过4字节才是16的倍数,则用0xdeadbeef填充,如果只跳过了1,2,3个字节则填充不确定,如果PC是16的倍数,则什么也不做*/

***************************************************************
* 当一个异常出现以后,ARM会自动执行以下几个步骤:
* (1) 把下一条指令的地址放到连接寄存器LR(通常是R14),这样就能够在处理异常返回时从正确的位置继续执行。
* (2) 将相应的CPSR(当前程序状态寄存器)复制到SPSR(备份的程序状态寄存器)中。从异常退出的时候,就可以由SPSR来恢复CPSR。
* (3) 根据异常类型,强制设置CPSR的运行模式位。
* (4) PC(程序计数器)被强制成相关异常向量处理函数地址,从而跳转到相应的异常处理程序中。
*
* 当异常处理完毕后,ARM会执行以下几步操作从异常返回:
* (1) 将连接寄存器LR的值减去相应的偏移量后送到PC中
* (2) 将SPSR复制回CPSR中
* (3) 若在进入异常处理时设置了中断禁止位,要在此清除
上述代码即碰到异常时,PC会被强制设置为对应的异常向量,从而跳转到
相应的处理程序,然后再返回到主程序继续执行。
******************************************************************

/*
 *************************************************************************
 *
 * Startup Code (reset vector)
 *
 * do important init only if we don't start from memory!
 * relocate armboot to ram
 * setup stack
 * jump to second stage
 *
 *************************************************************************
 */
/*保存变量的数据区*/
_TEXT_BASE:
    .word    TEXT_BASE

.globl _armboot_start
_armboot_start:
    .word _start

/*
 * These are defined in the board-specific linker script.
 */
.globl _bss_start
_bss_start:
    .word __bss_start

.globl _bss_end
_bss_end:
    .word _end

#ifdef CONFIG_USE_IRQ
/* IRQ stack memory (calculated at run-time) */
.globl IRQ_STACK_START
IRQ_STACK_START:
    .word    0x0badc0de

/* IRQ stack memory (calculated at run-time) */
.globl FIQ_STACK_START
FIQ_STACK_START:
    .word 0x0badc0de
#endif
/*****************************************************/
上述代码主要是用于保存一些全局变量,用于启动程序将代码从flash
拷贝到RAM或其他使用。有一些变量的值是通过链接脚本得到的,如
TEXT_BASE位于/u-boot-1.1.6/board/xxx(开发板目录名称)/config.mk
* 文件里。__bss_start、_end位于/u-boot-1.1.6/board/xxx(开发板目录名称)
/u-boot.lds文件里,具体值是由编译器算出来的。

/********************************************************/

/*
 * the actual reset code
 */

reset:
    /*
     * set the cpu to SVC32 mode ,在进入时将CPSR设置为监控模式,退出后改为用户模式
      * 运行模式位为:10011(svc mode)
     */
    mrs    r0,cpsr
    bic    r0,r0,#0x1f //r0=r0 AND (!0x1f),屏蔽所有中断,为中断提供服务通常是OS的设备驱动的责任,在bootloader执行中不需要中断
    orr    r0,r0,#0xd3 //逻辑或
    msr    cpsr,r0     //svc mode
/**************************************************************************/
*设置cpu运行在SVC32模式。ARM共有7种模式:
* 用户模式(usr): arm处理器正常的程序执行状态
* 快速中断模式(fiq): 用于高速数据传输或通道处理
* 外部中断模式(irq): 用于通用的中断处理
* 超级保护模式(svc): 操作系统使用的保护模式
* 数据访问终止模式(abt): 当数据或指令预取终止时进入该模式,可用于虚拟存储及存储保护
* 系统模式(sys): 运行具有特权的操作系统任务
* 未定义指令中止模式(und): 当未定义的指令执行时进入该模式,可用于支持硬件协处理器的软件仿真
* 通过设置ARM的CPSR寄存器,让CPU运行在操作系统保护模式,为后面进行其它操作作好准备了。
*************************************************************************/
/* turn off the watchdog */
#if defined(CONFIG_S3C2400)
# define pWTCON        0x15300000
# define INTMSK        0x14400008    /* Interupt-Controller base addresses */
# define CLKDIVN    0x14800014    /* clock divisor register */
#elif defined(CONFIG_S3C2410)
# define pWTCON        0x53000000
# define INTMSK        0x4A000008    /* Interupt-Controller base addresses */
# define INTSUBMSK    0x4A00001C
# define CLKDIVN    0x4C000014    /* clock divisor register */
#endif

#if defined(CONFIG_S3C2400) || defined(CONFIG_S3C2410)
    ldr     r0, =pWTCON
    mov     r1, #0x0
    str     r1, [r0]     //各个硬件还未就绪,关闭看门狗

    /*
     * mask all IRQs by setting all bits in the INTMR - default
     */
    mov    r1, #0xffffffff
    ldr    r0, =INTMSK
    str    r1, [r0]
# if defined(CONFIG_S3C2410)
    ldr    r1, =0x3ff
    ldr    r0, =INTSUBMSK
    str    r1, [r0]
# endif

    /* FCLK:HCLK:PCLK = 1:2:4 */ //FCLK用于CPU,HCLK用于AHB,PCLK用于APB
    /* default FCLK is 120 MHz ! */
    ldr    r0, =CLKDIVN
    mov    r1, #3
    str    r1, [r0]
#endif    /* CONFIG_S3C2400 || CONFIG_S3C2410 */

    /*初始化代码在系统重启的时候调用,运行时热复位从RAM中启动不执行
     * we do sys-critical inits only at reboot,
     * not when booting from ram!
     */
#ifndef CONFIG_SKIP_LOWLEVEL_INIT
    bl    cpu_init_crit   //初始化CPU
#endif

#ifndef CONFIG_SKIP_RELOCATE_UBOOT
relocate:                /* 重定位 U-Boot 到 RAM */
    adr    r0, _start        /* r0 <- current position of code   */
/*r0取得当前位置的地址,(见上面代码_start:    b       reset)当在flash中运行时(上电复位),r0=_start=0x0
;当此段在RAM中执行时,_start = _TEXT_BASE(在board/smdk2410/config.mk中指定的值为0x33F80000,即u-boot在把代码拷贝到RAM中去执行的代码段的开始)*/
    ldr    r1, _TEXT_BASE        /* 测试是从flash启动还是RAM,此时r1=_TEXT_BASE=0x33F80000,由编译器指定*/
    cmp     r0, r1                  /* 调试的时候不进行重定向    */
    beq     stack_setup    /*如果相等,则是从RAM执行,不进行重定向,直接跳转设置堆栈*/    

/*准备重定向代码,以上确定了复位启动代码是从flash启动,是系统重启,而不是软启动,就需要把flash中的代码拷贝到RAM中,下面计算需要拷贝的代码的长度*/
    ldr    r2, _armboot_start  /*把_armboot_start地址处的值也就是_start绝对地址(也即在内存中的地址,这个绝对地址是在 link 的时候确定的,如0x81008000)移到r2 ,r2=_armboot_start=_start=0x0*/
    ldr    r3, _bss_start      /*未初始化静态变量,把_bss_start地址处的值也就是__bss_start绝对地址(也即在内存中的地址,这个绝对地址是在 link 的时候确定的)移到r3*/
    sub    r2, r3, r2        /* r2=armboot大小           */
    add    r2, r0, r2        /* r2=要复制代码的末尾地址       */

copy_loop:
    ldmia    r0!, {r3-r10} /* 从源r0的地址(0x0)开始复制到r3-r10,同时更新[r0]=[r0]+8*4 */
    stmia    r1!, {r3-r10} /* 将r3-r10的内容拷贝到目的r1所在的地址(_TEXT_BASE=0x33F80000)同时更新[r1]=[r1]+8 */
    cmp    r0, r2            /* 循环复制数据块直到源数据末尾地址(r2)  */
    ble    copy_loop
#endif    /* CONFIG_SKIP_RELOCATE_UBOOT */

/*搬移的内存映像分布可参见如下图*/
/* 初始化堆栈        */
stack_setup:
    ldr    r0, _TEXT_BASE        /* upper 128 KiB: relocated uboot   */
    sub    r0, r0, #CFG_MALLOC_LEN    /* malloc area                      */
    sub    r0, r0, #CFG_GBL_DATA_SIZE /* bdinfo                        */
#ifdef CONFIG_USE_IRQ
    sub    r0, r0, #(CONFIG_STACKSIZE_IRQ+CONFIG_STACKSIZE_FIQ)
#endif                    
    sub    sp, r0, #12        /* leave 3 words for abort-stack    */
                        /*得到最终sp的值*/
clear_bss:
    ldr    r0, _bss_start        /* find start of bss segment        */
    ldr    r1, _bss_end        /* stop here                        */
    mov     r2, #0x00000000        /* clear                            */

clbss_l:str    r2, [r0]        /* clear loop...                    */
    add    r0, r0, #4
    cmp    r0, r1
    ble    clbss_l                  

/**********************************************************************/
* 已经准备好了堆栈,就可跳到C写的代码里了,也就是
* 跳到内存中的/u-boot-1.1.4/board.c --> start_armboot中运行了
* 把_start_armboot地址处的值也就是start_armboot绝对地址值移到pc
* 于是跳到C代码。
/*********************************************************************/

    ldr    pc, _start_armboot

_start_armboot:    .word start_armboot


/*
 *************************************************************************
 *
 * CPU_init_critical registers
 *
 * setup important registers
 * setup memory timing
 *
 *************************************************************************
 */

cpu_init_crit:
    /*
     * flush v4 I/D caches
     */
    mov    r0, #0
    mcr    p15, 0, r0, c7, c7, 0    /* flush v3/v4 cache */
/*使I/D cache失效: 协处理寄存器操作,将r0中的数据写入到协处理器p15的c7中,c7对应cp15的cache控制寄存器*/
    mcr    p15, 0, r0, c8, c7, 0    /* flush v4 TLB */
/*使TLB操作寄存器失效:将r0数据送到cp15的c8、c7中。C8对应TLB操作寄存器*/
/******************************************************************************************************
* MCR 指令用于将ARM 处理器寄存器中的数据传送到协处理器寄存器中,格式为:
* MCR 协处理器编码,协处理器操作码1,源寄存器,目的寄存器1,目的寄存器2,协处理器操作码2。
* 其中协处理器操作码1 和协处理器操作码2 为协处理器将要执行的操作,
* 源寄存器为ARM 处理器的寄存器,目的寄存器1 和目的寄存器2 均为协处理器的寄存器。
******************************************************************************************************/
    /*
     * disable MMU stuff and caches,禁止MMU和caches
     */
    mrc    p15, 0, r0, c1, c0, 0  //将c1、c0的值写入到r0中
    bic    r0, r0, #0x00002300    @ clear bits 13, 9:8 (--V- --RS)
    bic    r0, r0, #0x00000087    @ clear bits 7, 2:0 (B--- -CAM)
    orr    r0, r0, #0x00000002    @ set bit 2 (A) Align
    orr    r0, r0, #0x00001000    @ set bit 12 (I) I-Cache
    mcr    p15, 0, r0, c1, c0, 0  //将设置好的r0值写入到协处理器p15的c1、c0中

    /*
     * before relocating, we have to setup RAM timing
     * because memory timing is board-dependend, you will
     * find a lowlevel_init.S in your board directory.
     */
    mov    ip, lr   //保存前一个跳转地址,防止下一个跳转将前一个lr地址覆盖
    bl    lowlevel_init //board/smdk2410/lowlevel_init.S:用于完成芯片存储器的初始化
    mov    lr, ip
    mov    pc, lr   //返回cpu_init_crit函数

2.Stage2:lib_arm/board.c
    此文件是u-boot Stage2部分,入口为Stage1最后调用的start_armboot函数。注意上面最后ldr到pc的是_start_armboot这个地址,而非start_armboot变量。
    start_armboot是U-Boot执行的第一个C语言函数,完成如下工作:
1. 初始化MMU
2.初始化外部端口
3. 中断处理程序表初始化
4. 串口初始化
5. 其它部分初始化(可选)
6. 主程序循环

void start_armboot (void)
{
       DECLARE_GLOBAL_DATA_PTR;
//此宏定义了一个gd_t类型的指针 *gd,并指名用r8寄存器来存储:
#define DECLARE_GLOBAL_DATA_PTR register volatile gd_t *gd asm ("r8")
       ulong size;
       init_fnc_t **init_fnc_ptr;
       char *s;
       /* Pointer is writable since we allocated a register for it     上面那个宏的作用*/
       gd = (gd_t*)(_armboot_start - CFG_MALLOC_LEN - sizeof(gd_t));
//
此C语句引用的是start.S中的地址标号_armboot_start,但是得到的却是其中所指的变量_start的值(在RAM中,_start
= 0x33F80000)。    Ps:    _armboot_start:    .word _start
//gd是全局变量,位置在堆栈区以下(低地址):
typedef struct global_data {
    bd_t *bd;
    unsigned long flags;
    unsigned long baudrate;
    unsigned long have_console; /* serial_init() was called */
    unsigned long reloc_off; /* Relocation Offset */     
    unsigned long env_addr; /* Address of Environment struct */
    unsigned long env_valid; /* Checksum of Environment valid? */
    unsigned long fb_base; /* base address of frame buffer */
#ifdef CONFIG_VFD
    unsigned char vfd_type; /* display type */
#endif
#if 0
    unsigned long cpu_clk; /* CPU clock in Hz! */
    unsigned long bus_clk;
    unsigned long ram_size; /* RAM size */
    unsigned long reset_status; /* reset status register at boot */
#endif
    void **jt; /* jump table */
} gd_t;
       /* compiler optimization barrier needed for GCC >= 3.4 */
       __asm__ __volatile__("": : :"memory");
       memset ((void*)gd, 0, sizeof (gd_t));
       gd->bd = (bd_t*)((char*)gd - sizeof(bd_t));    //得到bd的起点
       memset (gd->bd, 0, sizeof (bd_t));
       monitor_flash_len = _bss_start - _armboot_start;
       /* 顺序执行init_sequence数组中的初始化函数 */
       for (init_fnc_ptr = init_sequence; *init_fnc_ptr; ++init_fnc_ptr) {
              if ((*init_fnc_ptr)() != 0) {
                      hang ();
              }
       }
       /*配置可用的Flash */
       size = flash_init ();        //初始化Nor flash的函数,函数实现在下面
       display_flash_config (size);    //打印到控制台:Flash: 512 kB
       /* _armboot_start 在u-boot.lds链接脚本中定义 */
       mem_malloc_init (_armboot_start - CFG_MALLOC_LEN);        //将CFG_MALLOC_LEN区域用memset函数清零(直接往目的地址写0)
       /* 配置环境变量,重新定位 */
       env_relocate ();        //刚才的初始化函数中有一个是env_init(),根据CRC校验来初始化gd->env_addr变量(自己设定的还是初始值),此函 数是作用是将环境变量值从某个flash和RAM之间的拷贝。下图描述了ENV的初始化过程:
 

/* 从环境变量中获取IP地址,放到全局变量gd中 */
       gd->bd->bi_ip_addr = getenv_IPaddr ("ipaddr");
       /* 以太网接口MAC 地址,放到全局变量gd中*/
          {
        int i;
        ulong reg;
        char *s, *e;
        uchar tmp[64];
        i = getenv_r ("ethaddr", tmp, sizeof (tmp));
        s = (i > 0) ? tmp : NULL;
        for (reg = 0; reg  6; ++reg) {
            gd->bd->bi_enetaddr[reg] = s ? simple_strtoul (s, &e, 16) : 0;
            if (s)
                s = (*e) ? e + 1 : e;
        }
    }
       devices_init (); /* 获取列表中的设备 */
       jumptable_init ();
       console_init_r (); /* 完整地初始化控制台设备 */
       enable_interrupts (); /* 使能例外处理 */
       /* 通过环境变量初始化 */
       if ((s = getenv ("loadaddr")) != NULL) {
               load_addr = simple_strtoul (s, NULL, 16);
       }
       /* main_loop()总是试图自动启动,循环不断执行 */
       for (;;) {
               main_loop (); /* 主循环函数处理执行用户命令 -- common/main.c */
       }
       /* NOTREACHED - no way out of command loop except booting */
}



阅读(2939) | 评论(2) | 转发(4) |
给主人留下些什么吧!~~

chinaunix网友2009-11-11 23:36:58

stmia r1!, {r3-r10} /* 将r3-r10的内容拷贝到目的r1所在的地址(_TEXT_BASE=0x33F80000)同时更新[r1]=[r1]+8 */ 上面的应该是(_TEXT_BASE=0x33F80000)同时更新[r1]=[r1]+8 *4/吧?少一个乘4好像地址增加8个字共32个字节应该

chinaunix网友2009-11-11 23:24:21

写的不错,谢谢了