首页　| 　博文目录　| 　关于我

博客访问： 9672695
博文数量： 1778
博客积分： 12961
博客等级：上将
技术积分： 20371
用户组：普通用户
注册时间： 2009-01-09 11:25

个人简介

偷得浮生半桶水(半日闲), 好记性不如抄下来(烂笔头). 信息爆炸的时代, 学习是一项持续的工作.

文章分类

全部博文（1778）

TX2-NX（83）
OpenHarmony（26）
debug（374）
Python3.x（19）
AI-DeepLearning（7）
VR/AR/MR（5）
Cuda（6）
机器人（355）
GTK3 + （35）
android4.x代码分（35）
linux设备驱动第（39）
原创（50）

ER69XX项目归纳（5）
ARMLINUX技术文摘（42）

驱动（18）
Porting（73）

Delphi（12）

dotNet（13）

Meego（4）

Kernel（25）

U-BOOT（7）
代码分析（6）
移植（13）
sysfs 全接触（1）
skyeye（1）
音视频（2）
android（33）

Oracle（15）
wince（10）
linux 驱动（18）
前沿文摘（24）
GTK（11）
杂项（18）

工作（6）
日志（16）
娱乐（28）
linux 系统（46）
linux 应用（56）
armlinux（79）
未分配的博文（267）

文章存档

2025年（27）

2024年（27）

2023年（26）

2022年（112）

2021年（217）

2020年（157）

2019年（192）

2018年（81）

2017年（78）

2016年（70）

2015年（52）

2014年（40）

2013年（51）

2012年（85）

2011年（45）

2010年（231）

2009年（287）

我的朋友

相关博文

linux内核启动过程——基于S3C2410

分类： LINUX

2010-05-14 14:55:41

（1）zImage自解压
本文以流行的Samsung公司的S3C2410，mini2440平台和linux-2.6.29为例，介绍如何在ZIX嵌入式开发环境下探索linux内核启动过程。
Linux 内核启动一般由外部的bootloader引导，也可以在内核头部嵌入一个loader，实际的应用中这两种方式都会经常遇到。所以要了解内核启动最开始的过程，必须对bootloader如何引导内核有所熟悉。下面我们从u-boot加载linux内核的代码开始分析（关于u-boot 自身的启动流程，请参考

）。
1.处理器内核加载代码
在u-boot的

里，实现了处理器架构相关的linux内核加载代码，特别是tags传递。
该函数中，在(u-boot-1.6)lib_arm/armlinux.c的

调用了getenv将bootargs环境变量保存在commandline
char *commandline =

("bootargs");
然后解析uImage文件头，并且按照头中的定义分解和加载uImage。所以这部分代码的运行取决于uImage文件是如何生成的，本文不做过多叙述，可参考另文了解u-boot使用。接下来进行tags设置工作，分别调用了
setup_start_tag()
setup_memory_tag()
setup_commandline_tag()
setup_initrd_tag()
setup_end_tag()
然后对TLB、cache等进行invalid操作，这是通过在lib_arm/armlinux.c的

调用

(cpu/arm920t/108)实现，然后即可跳入从uImage中分解出来的内核Image或zImage入口
cleanup_before_linux ();
theKernel (0, machid, bd->bi_boot_params);
/* does not return */
return;
在 s3c2410平台上，该入口theKernel一般是物理地址0x30008000。如果我们使用zImage自解压内核映像，对应的代码正是自解压头，位置在内核源码linux-2.6.29的arch/arm/boot/compressed/head.S第 114行的start符号
   start:
            .type start,#function
            .rept 8
            mov    r0, r0
            .endr

            b    1f
            .word 0x016f2818 @ Magic numbers to help the loader
            .word start       @ absolute load/run zImage address
            .word _edata    @ zImage end address
1:             mov    r7, r1    @ save architecture ID
            mov    r8, r2    @ save atags pointer
这也标志着u-boot将系统完全的交给了OS，bootloader生命终止。之后代码在133行会读取cpsr并判断是否处理器处于supervisor模式——从u-boot进入kernel，系统已经处于SVC32模式；而利用angel进入则处于user模式，还需要额外两条指令。之后是再次确认中断关闭，并完成cpsr写入
            mrs    r2, cpsr             @ get current mode
            tst    r2, #3                @ not user?
            bne    not_angel
            mov    r0, #0x17             @ angel_SWIreason_EnterSVC
            swi    0x123456             @ angel_SWI_ARM
not_angel:
            mrs    r2, cpsr             @ turn off interrupts to
            orr    r2, r2, #0xc0          @ prevent angel from running
            msr    cpsr_c, r2
然后在LC0地址(157行)处将分段信息导入r0-r6、ip、sp等寄存器，并检查代码是否运行在与链接时相同的目标地址(162行)，以决定是否进行处理。由于现在很少有人不使用loader和tags，将zImage烧写到rom直接从0x0位置执行，所以这个处理是必须的（但是zImage的头现在也保留了不用loader也可启动的能力）。arm架构下自解压头一般是链接在0x0地址而被加载到0x30008000运行，所以要修正这个变化。涉及到
r5寄存器存放的zImage基地址
r6和r12（即ip寄存器）存放的got（global offset table）
r2和r3存放的bss段起止地址
sp栈指针地址
很简单，这些寄存器统统被加上一个你也能猜到的偏移地址 0x30008000。该地址是s3c2410相关的，其他的ARM处理器可以参考下表
PXA2xx是0xa0008000
IXP2x00和IXP4xx是0x00008000
Freescale i.MX31/37是0x80008000

TI davinci DM64xx是0x80008000
TI omap系列是0x80008000
AT91RM/SAM92xx系列是0x20008000
Cirrus EP93xx是0x00008000
这些操作发生在代码172行开始的地方，下面只粘贴一部分
            add    r5, r5, r0
            add    r6, r6, r0
            add    ip, ip, r0
后面在211行进行bss段的清零工作
not_relocated:  mov    r0, #0
1:             str    r0, [r2], #4          @ clear bss
            str    r0, [r2], #4
            str    r0, [r2], #4
            str    r0, [r2], #4
            cmp    r2, r3
            blo    1b
然后224行，打开cache，并为后面解压缩设置64KB的临时malloc空间
            bl    cache_on

            mov    r1, sp             @ malloc space above stack
            add    r2, sp, #0x10000 @ 64k max
接下来238行进行检查，确定内核解压缩后的Image目标地址是否会覆盖到zImage头，如果是则准备将zImage头转移到解压出来的内核后面
            cmp    r4, r2
            bhs    wont_overwrite
            sub    r3, sp, r5             @ > compressed kernel size
            add    r0, r4, r3, lsl #2    @ allow for 4x expansion
            cmp    r0, r5
            bls    wont_overwrite

            mov    r5, r2                @ decompress after malloc space
            mov    r0, r5
            mov    r3, r7
            bl    decompress_kernel
真实情况——在大多数的应用中，内核编译都会把压缩的zImage和非压缩的Image链接到同样的地址，s3c2410平台下即是0x30008000。这样做的好处是，人们不用关心内核是Image还是zImage，放到这个位置执行就OK，所以在解压缩后zImage头必须为真正的内核让路。
在250行解压完毕，内核长度返回值存放在r0寄存器里。在内核末尾空出128字节的栈空间用，并且使其长度128字节对齐。
            add    r0, r0, #127 + 128    @ alignment + stack
            bic    r0, r0, #127          @ align the kernel length
算出搬移代码的参数：计算内核末尾地址并存放于r1寄存器，需要搬移代码原来地址放在r2，需要搬移的长度放在r3。然后执行搬移，并设置好sp指针指向新的栈（原来的栈也会被内核覆盖掉）
            add    r1, r5, r0             @ end of decompressed kernel
            adr    r2, reloc_start
            ldr    r3, LC1
            add    r3, r2, r3
1:             ldmia r2!, {r9 - r14}       @ copy relocation code
            stmia r1!, {r9 - r14}
            ldmia r2!, {r9 - r14}
            stmia r1!, {r9 - r14}
            cmp    r2, r3
            blo    1b
            add    sp, r1, #128          @ relocate the stack
搬移完成后刷新cache，因为代码地址变化了不能让cache再命中被内核覆盖的老地址。然后跳转到新的地址继续执行
            bl    cache_clean_flush
            add    pc, r5, r0             @ call relocation code
注意——zImage在解压后的搬移和跳转会给gdb调试内核带来麻烦。因为用来调试的符号表是在编译是生成的，并不知道以后会被搬移到何处去，只有在内核解压缩完成之后，根据计算出来的参数“告诉”调试器这个变化。以撰写本文时使用的zImage为例，内核自解压头重定向后，reloc_start地址由 0x30008360变为0x30533e60。故我们要把vmlinux的符号表也相应的从0x30008000后移到0x30533b00开始，这样 gdb就可以正确的对应源代码和机器指令。
随着头部代码移动到新的位置，不会再和内核的目标地址冲突，可以开始内核自身的搬移了。此时r0寄存器存放的是内核长度（严格的说是长度外加128Byte的栈），r4存放的是内核的目的地址0x30008000，r5是目前内核存放地址，r6是CPU ID，r7是machine ID，r8是atags地址。代码从501行开始
reloc_start: add    r9, r5, r0
            sub    r9, r9, #128          @ do not copy the stack
            debug_reloc_start
            mov    r1, r4
1:
            .rept 4
            ldmia r5!, {r0, r2, r3, r10 - r14} @ relocate kernel
            stmia r1!, {r0, r2, r3, r10 - r14}

            .endr

            cmp    r5, r9
            blo    1b
            add    sp, r1, #128          @ relocate the stack
接下来在516行清除并关闭cache，清零r0，将machine ID存入r1，atags指针存入r2，再跳入0x30008000执行真正的内核Image
call_kernel: bl    cache_clean_flush
            bl    cache_off
            mov    r0, #0                @ must be zero
            mov    r1, r7                @ restore architecture number
            mov    r2, r8                @ restore atags pointer
            mov    pc, r4                @ call kernel
zImage自解压过程结束。欲了解内核Image启动流程

从zImage头跳转进来，此时的状态

MMU为off
D-cache为off
I-cache为dont care，on或off没有关系
r0为0
r1为machine ID
r2为atags指针

1.检查CPU ID的合法性

内核代码入口在linux-2.6.29/arch/arm/kernel/head.S文件的78行。首先进入SVC32模式，并查询CPU ID，检查合法性

msr cpsr_c, #PSR_F_BIT | PSR_I_BIT | SVC_MODE @ ensure svc mode

@ and irqs disabled

mrc p15, 0, r9, c0, c0 @ get processor id

bl __lookup_processor_type @ r5=procinfo r9=cpuid

movs r10, r5 @ invalid processor (r5=0)?

beq __error_p @ yes, error 'p'

其中__lookup_processor_type在linux-2.6.29/arch/arm/kernel/head-common.S文件的156行，该函数首将标号3的实际地址加载到r3，然后将编译时生成的__proc_info_begin虚拟地址载入到r5，__proc_info_end虚拟地址载入到r6，标号3的虚拟地址载入到r7。由于adr伪指令和标号3的使用，以及__proc_info_begin等符号在linux-2.6.29/arch/arm/kernel/vmlinux.lds而不是代码中被定义，此处代码不是非常直观，想弄清楚代码缘由的读者请耐心阅读这两个文件和adr伪指令的说明。

r3和r7分别存储的是同一位置标号3的物理地址（由于没有启用mmu，所以当前肯定是物理地址）和虚拟地址，所以二者相减即得到虚拟地址和物理地址之间的offset。利用此offset，将r5和r6中保存的虚拟地址转变为物理地址

__lookup_processor_type:

adr r3, 3f

ldmda r3, {r5 - r7}

sub r3, r3, r7 @ get offset between virt&phys

add r5, r5, r3 @ convert virt addresses to

add r6, r6, r3 @ physical address space

然后从proc_info中读出内核编译时写入的processor ID和之前从cpsr中读到的processor ID对比，查看代码和CPU硬件是否匹配（想在arm920t上运行为cortex-a8编译的内核？不让！）。如果编译了多种处理器支持，如versatile板，则会循环每种type依次检验，如果硬件读出的ID在内核中找不到匹配，则r5置0返回（在83行检查processor id时状态寄存器Z位置零）。

1: ldmia r5, {r3, r4} @ value, mask

and r4, r4, r9 @ mask wanted bits

teq r3, r4

beq 2f

add r5, r5, #PROC_INFO_SZ @ sizeof(proc_info_list)

cmp r5, r6

blo 1b

mov r5, #0 @ unknown processor

2: mov pc, lr

2.检查machine ID合法性

接着在85行进一步查询machine ID并检查合法性

bl __lookup_machine_type @ r5=machinfo

movs r8, r5 @ invalid machine (r5=0)?

beq __error_a @ yes, error 'a'

__lookup_machine_type在linux-2.6.29/arch/arm/kernel/head-common.S文件的205行，编码方法与检查processor ID完全一样，请参考前段。macheine type在linux-2.6.29/arch/arm/tools/mach-types里定义，与uboot中的board/mini2440/mini2440.c里定义的的gd->bd->bi_arch_number=**相匹配，在uboot引导内核时传递。

__lookup_machine_type:

adr r3, 3b

ldmia r3, {r4, r5, r6}

sub r3, r3, r4 @ get offset between virt&phys

add r5, r5, r3 @ convert virt addresses to

add r6, r6, r3 @ physical address space

1: ldr r3, [r5, #MACHINFO_TYPE] @ get machine type

teq r3, r1 @ matches loader number?

beq 2f @ found

add r5, r5, #SIZEOF_MACHINE_DESC @ next machine_desc

cmp r5, r6

blo 1b

mov r5, #0 @ unknown machine

2: mov pc, lr

3.检查atags合法性，创建初始页表

代码回到head.S第88行，检查atags合法性，然后创建初始页表

bl __vet_atags

bl __create_page_tables

3.1创建页表

__vet_atags在linux-2.6.29/arch/arm/kernel/head-common.S文件的244行。创建页表的代码在214行，首先将内核起始地址到内核起始地址+0x4000地址之间的16K存储器清0。

__create_page_tables:

pgtbl r4 @ page table address

* Clear the 16K level 1 swapper page table

mov r0, r4

mov r3, #0

add r6, r0, #0x4000

1: str r3, [r0], #4

str r3, [r0], #4

teq r0, r6

bne 1b

从第238行开始创建页表，该初始页表将在paging_int()函数中remove。

ldr r7, [r10, #PROCINFO_MM_MMUFLAGS] @ mm_mmuflags

* Create identity mapping for first MB of kernel to

* cater for the MMU enable. This identity mapping

* will be removed by paging_init(). We use our current program

* counter to determine corresponding section base address.

mov r6, pc, lsr #20 @ start of kernel section

orr r3, r7, r6, lsl #20 @ flags + kernel base

str r3, [r4, r6, lsl #2] @ identity mapping

* Now setup the pagetables for our kernel direct

* mapped region.

add r0, r4, #(KERNEL_START & 0xff000000) >> 18

str r3, [r0, #(KERNEL_START & 0x00f00000) >> 18]!

ldr r6, =(KERNEL_END - 1)

add r0, r0, #4

add r6, r4, r6, lsr #18

1: cmp r0, r6

add r3, r3, #1 << 20

strls r3, [r0], #4

bls 1b

3.2设置映射标识

然后在230行将proc_info中的mmu_flags加载到r7

ldr r7, [r10, #PROCINFO_MM_MMUFLAGS] @ mm_mmuflags

在238行将PC指针右移20位，得到内核第一个1MB空间的段地址存入r6，在s3c2410平台该值是0x300（0x300xxxxx右移20位）。接着根据此值存入映射标识

mov r6, pc, lsr #20 @ start of kernel section

orr r3, r7, r6, lsl #20 @ flags + kernel base

str r3, [r4, r6, lsl #2] @ identity mapping

3.3为打开虚拟地址映射作准备

完成页表设置后回到98行，为打开虚拟地址映射作准备。设置sp指针，函数返回地址lr指向__enable_mmu，并跳转到linux-2.6.29/arch/arm/mm/proc-arm920.S的364行，清除I-cache、D-cache、write buffer和TLB

__arm920_setup:

mov r0, #0

mcr p15, 0, r0, c7, c7 @ invalidate I,D caches on v4

mcr p15, 0, r0, c7, c10, 4 @ drain write buffer on v4

#ifdef CONFIG_MMU

mcr p15, 0, r0, c8, c7 @ invalidate I,D TLBs on v4

#endif

3.4使能mmu

然后返回head.S的155行（在127行将__enable_mmu的地址放到lr中），加载domain和页表，跳转到__turn_mmu_on

__enable_mmu:

#ifdef CONFIG_ALIGNMENT_TRAP

orr r0, r0, #CR_A

#else

bic r0, r0, #CR_A

#endif

#ifdef CONFIG_CPU_DCACHE_DISABLE

bic r0, r0, #CR_C

#endif

#ifdef CONFIG_CPU_BPREDICT_DISABLE

bic r0, r0, #CR_Z

#endif

#ifdef CONFIG_CPU_ICACHE_DISABLE

bic r0, r0, #CR_I

#endif

mov r5, #(domain_val(DOMAIN_USER, DOMAIN_MANAGER) | \

domain_val(DOMAIN_KERNEL, DOMAIN_MANAGER) | \

domain_val(DOMAIN_TABLE, DOMAIN_MANAGER) | \

domain_val(DOMAIN_IO, DOMAIN_CLIENT))

mcr p15, 0, r5, c3, c0, 0 @ load domain access register

mcr p15, 0, r4, c2, c0, 0 @ load page table pointer

b __turn_mmu_on

在194行把mmu使能位写入mmu，激活虚拟地址。

mov r0, r0

mcr p15, 0, r0, c1, c0, 0 @ write control reg

mrc p15, 0, r3, c0, c0, 0 @ read id reg

mov r3, r3

mov pc, r13

4.进入虚拟地址

然后将原来保存在sp中的地址（98行）载入pc，跳转到head-common.S的__switch_data（18行）和__mmap_switched，至此代码进入虚拟地址的世界

在head-common.S的49行开始清除内核bss段，processor ID保存在r9，machine ID报存在r1，atags地址保存在r2，并将控制寄存器保存到r7定义的内存地址。接下来跳入linux-2.6.29/init/main.c的530行，start_kernel函数。这里只粘贴部分代码

__mmap_switched:

adr r3, __switch_data + 4

ldmia r3!, {r4, r5, r6, r7}

cmp r4, r5 @ Copy data segment if needed

1: cmpne r5, r6

ldrne fp, [r4], #4

strne fp, [r5], #4

bne 1b

在main.c第530行，是硬件无关的C初始化代码

asmlinkage void __init start_kernel(void)

{

char * command_line;

extern struct kernel_param __start___param[], __stop___param[];

smp_setup_processor_id();

s3c2410平台linux-2.6.24内核早期的汇编初始化到这里就结束了.

阅读(1927) | 评论(0) | 转发(1) |

上一篇：U-BOOT全线移植(2)

下一篇：博客收藏

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6