qemu源代码分析（一）-sigsegv11-ChinaUnix博客

unixmindwangbj.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

sigsegv11

博客访问： 181532
博文数量： 42
博客积分： 2185
博客等级：大尉
技术积分： 455
用户组：普通用户
注册时间： 2009-06-11 21:32

文章分类

全部博文（42）

plan（1）
algo（6）
misc（9）
linux（19）
u-boot（0）
qemu（7）
未分配的博文（0）

文章存档

2012年（5）

2011年（13）

2010年（6）

2009年（18）

我的朋友

相关博文

qemu源代码分析（一）

分类： LINUX

2009-06-15 22:26:02

                 qemu源代码分析

        第一部分 qemu oldworld mac(heathrow)的初始化

约定：

qemu版本: 0.10.5
分析的目标机器: heathrow (oldmac)
目标处理器架构: PPC（包括7x0/750, BookE, FSL-BookE）

我们从hw/ppc_oldworld.c开始，函数：

static void ppc_heathrow_init(...);

其中的一个重要的函数：
void cpu_register_physical_memory(target_phys_addr_t start_addr, ram_addr_t size, ram_addr_t phys_offset);

/* register physical memory. 'size' must be a multiple of the target
   page size. If (phys_offset & ~TARGET_PAGE_MASK) != 0, then it is an
   io memory page. The address used when calling the IO function is
   the offset from the start of the region, plus region_offset. Both
   start_region and regon_offset are rounded down to a page boundary
   before calculating this offset. This should not be a problem unless
   the low bits of start_addr and region_offset differ. */
void cpu_register_physical_memory_offset(target_phys_addr_t start_addr,
                                         ram_addr_t size,
                                         ram_addr_t phys_offset,
                                         ram_addr_t region_offset)
{
    target_phys_addr_t addr, end_addr;
    PhysPageDesc *p;
    CPUState *env;
    ram_addr_t orig_size = size;
    void *subpage;

#ifdef USE_KQEMU
    /* XXX: should not depend on cpu context */
    env = first_cpu;
    if (env->kqemu_enabled) {
        kqemu_set_phys_mem(start_addr, size, phys_offset);
    }
#endif
    if (kvm_enabled())
        kvm_set_phys_mem(start_addr, size, phys_offset);

    if (phys_offset == IO_MEM_UNASSIGNED) {
        region_offset = start_addr;
    }
    region_offset &= TARGET_PAGE_MASK;
    size = (size + TARGET_PAGE_SIZE - 1) & TARGET_PAGE_MASK;
    end_addr = start_addr + (target_phys_addr_t)size;
    for(addr = start_addr; addr != end_addr; addr += TARGET_PAGE_SIZE) {
        p = phys_page_find(addr >> TARGET_PAGE_BITS);
        if (p && p->phys_offset != IO_MEM_UNASSIGNED) {
            ram_addr_t orig_memory = p->phys_offset;
            target_phys_addr_t start_addr2, end_addr2;
            int need_subpage = 0;

            CHECK_SUBPAGE(addr, start_addr, start_addr2, end_addr, end_addr2,
                          need_subpage);
            if (need_subpage || phys_offset & IO_MEM_SUBWIDTH) {
                if (!(orig_memory & IO_MEM_SUBPAGE)) {
                    subpage = subpage_init((addr & TARGET_PAGE_MASK),
                                           &p->phys_offset, orig_memory,
                                           p->region_offset);
                } else {
                    subpage = io_mem_opaque[(orig_memory & ~TARGET_PAGE_MASK)
                                            >> IO_MEM_SHIFT];
                }
                subpage_register(subpage, start_addr2, end_addr2, phys_offset,
                                 region_offset);
                p->region_offset = 0;
            } else {
                p->phys_offset = phys_offset;
                if ((phys_offset & ~TARGET_PAGE_MASK) <= IO_MEM_ROM ||
                    (phys_offset & IO_MEM_ROMD))
                    phys_offset += TARGET_PAGE_SIZE;
            }
        } else {
            p = phys_page_find_alloc(addr >> TARGET_PAGE_BITS, 1);
            p->phys_offset = phys_offset;
            p->region_offset = region_offset;
            if ((phys_offset & ~TARGET_PAGE_MASK) <= IO_MEM_ROM ||
                (phys_offset & IO_MEM_ROMD)) {
                phys_offset += TARGET_PAGE_SIZE;
            } else {
                target_phys_addr_t start_addr2, end_addr2;
                int need_subpage = 0;

                CHECK_SUBPAGE(addr, start_addr, start_addr2, end_addr,
                              end_addr2, need_subpage);

                if (need_subpage || phys_offset & IO_MEM_SUBWIDTH) {
                    subpage = subpage_init((addr & TARGET_PAGE_MASK),
                                           &p->phys_offset, IO_MEM_UNASSIGNED,
                                           addr & TARGET_PAGE_MASK);
                    subpage_register(subpage, start_addr2, end_addr2,
                                     phys_offset, region_offset);
                    p->region_offset = 0;
                }
            }
        }
        region_offset += TARGET_PAGE_SIZE;
    }

    /* since each CPU stores ram addresses in its TLB cache, we must
       reset the modified entries */
    /* XXX: slow ! */
    for(env = first_cpu; env != NULL; env = env->next_cpu) {
        tlb_flush(env, 1);
    }
}

==> phys_page_find() ==> phys_page_find_alloc(target_phys_addr_t index, int alloc);

static PhysPageDesc *phys_page_find_alloc(target_phys_addr_t index, int alloc)
{
    void **lp, **p;
    PhysPageDesc *pd;

    p = (void **)l1_phys_map;
#if TARGET_PHYS_ADDR_SPACE_BITS > 32

#if TARGET_PHYS_ADDR_SPACE_BITS > (32 + L1_BITS)
#error unsupported TARGET_PHYS_ADDR_SPACE_BITS
#endif
    lp = p + ((index >> (L1_BITS + L2_BITS)) & (L1_SIZE - 1));
    p = *lp;
    if (!p) {
        /* allocate if not found */
        if (!alloc)
            return NULL;
        p = qemu_vmalloc(sizeof(void *) * L1_SIZE);
        memset(p, 0, sizeof(void *) * L1_SIZE);
        *lp = p;
    }
#endif
    lp = p + ((index >> L2_BITS) & (L1_SIZE - 1));
    pd = *lp;
    if (!pd) {
        int i;
        /* allocate if not found */
        if (!alloc)
            return NULL;
        pd = qemu_vmalloc(sizeof(PhysPageDesc) * L2_SIZE);
        *lp = pd;
        for (i = 0; i < L2_SIZE; i++) {
          pd[i].phys_offset = IO_MEM_UNASSIGNED;
          pd[i].region_offset = (index + i) << TARGET_PAGE_BITS;
        }
    }
    return ((PhysPageDesc *)pd) + (index & (L2_SIZE - 1));
}

这段代码为qemu为target的页表管理的实现。
其中L1_BITS, L2_BITS, L1_SIZE, L2_SIZE分别一级页表以及二级页表的bits与size.
TARGET_PAGE_BITS为target的page需要的bits。
以传统的二级页表为例，他们的分配分别为：
L1_BITS = 10
L2_BITS = 10
PAGE_BITS = 12
l1_phys_map为一级页表的首地址。

在函数开始的时候
    p = (void**)l1_phys_map;
因此
    lp = p + ((index >> L2_BITS) & (L1_SIZE - 1));
    pd = *lp;

lp为一级页表的offset，pd则为pgd[offset]。如果alloc==0，这个函数将返回：
    return ((PhysPageDesc *)pd) + (index & (L2_SIZE - 1));
也就是二级页表的地址，也就是pte entry的地址；否则当搜索的pte entry不存在是，自动分配内存给要求的pte entry，并返回这个pte entry。

需要注意的是当TARGET_PHYS_ADDR_SPACE_BITS > 32时，通常我们需要三级页表，如对ppc64，TARGET_PHYS_ADDR_SPACE_BITS == 42，因此我们需要多做一个页表搜索才能得到pte entry的地址。
    lp = p + ((index >> (L1_BITS + L2_BITS)) & (L1_SIZE - 1));
    p = *lp;
L1_BITS,L2_BITS这里其实相当于第二级与第三级页表的bits。
index传进来的时候是一个地址右移了PAGE_BITS，经过上面的操作后就变成了三级页表的第一级的offset了（由于代码里写的是L1_BITS, L2BITS，我们可以假定第一级为L0_BITS）。

如果不考虑特殊情况，函数cpu_register_physical_memory()做的事情到此已经结束，即：搜索（分配）根据addr与size相关参数确定的pte entry。其中最重要的是我们知道qemu模拟了目标架构的MMU(softmmu).

// 考虑特殊情况（FIXME）

当ppc_heathrow_init()时，我们分别注册了以下内存区域：

    ram_offset = qemu_ram_alloc(ram_size);
    cpu_register_physical_memory(0, ram_size, ram_offset);

    bios_offset = qemu_ram_alloc(BIOS_SIZE);
    cpu_register_physical_memory(PROM_ADDR, BIOS_SIZE, bios_offset | IO_MEM_ROM);

重要函数:
/* return < 0 if error, otherwise the number of bytes loaded in memory */
int load_elf(const char *filename, int64_t address_offset,
             uint64_t *pentry, uint64_t *lowaddr, uint64_t *highaddr)

==> load_elf_32() or load_elf_64()

我们以load_elf_32为例(ppc heathrow)，这个函数在文件elf_ops.h中定义；实际上这个文件做了一点小小的手段，导致我们定义SZ=32或SZ=64是，#include这个文件两次，我们就生成了需要的相关_xxx_32或是_xxx_64函数（都是静态的）。如：

static int glue(load_elf, SZ)(int fd, int64_t address_offset,
                              int must_swab, uint64_t *pentry,
                              uint64_t *lowaddr, uint64_t *highaddr)

==>

static int load_elf_32(...) or
static int load_elf_64(...)

为了便于阅读，我们假定SZ=32，将上面的函数略做替代之后，得到：

static int load_elf_32(int fd, int64_t address_offset,
                              int must_swab, uint64_t *pentry,
                              uint64_t *lowaddr, uint64_t *highaddr)
{
    struct elfhdr ehdr;
    struct elf_phdr *phdr = NULL, *ph;
    int size, i, total_size;
    elf_word mem_size;
    uint64_t addr, low = 0, high = 0;
    uint8_t *data = NULL;

    if (read(fd, &ehdr, sizeof(ehdr)) != sizeof(ehdr))
        goto fail;
    if (must_swab) {
        bswap_ehdr_32(&ehdr);
    }

    if (ELF_MACHINE != ehdr.e_machine)
        goto fail;

    if (pentry)
       *pentry = (uint64_t)(elf_sword)ehdr.e_entry;

    load_symbols_32(&ehdr, fd, must_swab);

    size = ehdr.e_phnum * sizeof(phdr[0]);
    lseek(fd, ehdr.e_phoff, SEEK_SET);
    phdr = qemu_mallocz(size);
    if (!phdr)
        goto fail;
    if (read(fd, phdr, size) != size)
        goto fail;
    if (must_swab) {
        for(i = 0; i < ehdr.e_phnum; i++) {
            ph = &phdr[i];
            bswap_phdr_32(ph);
        }
    }

    total_size = 0;
    for(i = 0; i < ehdr.e_phnum; i++) {
        ph = &phdr[i];
        if (ph->p_type == PT_LOAD) {
            mem_size = ph->p_memsz;
            /* XXX: avoid allocating */
            data = qemu_mallocz(mem_size);
            if (ph->p_filesz > 0) {
                if (lseek(fd, ph->p_offset, SEEK_SET) < 0)
                    goto fail;
                if (read(fd, data, ph->p_filesz) != ph->p_filesz)
                    goto fail;
            }
            /* address_offset is hack for kernel images that are
               linked at the wrong physical address. */
            addr = ph->p_paddr + address_offset;

            cpu_physical_memory_write_rom(addr, data, mem_size);

            total_size += mem_size;
            if (!low || addr < low)
                low = addr;
            if (!high || (addr + mem_size) > high)
                high = addr + mem_size;

            qemu_free(data);
            data = NULL;
        }
    }
    qemu_free(phdr);
    if (lowaddr)
        *lowaddr = (uint64_t)(elf_sword)low;
    if (highaddr)
        *highaddr = (uint64_t)(elf_sword)high;
    return total_size;
fail:
    qemu_free(data);
    qemu_free(phdr);
    return -1;
}

了解一点loader与ELF文件格式的都会知道，ELF文件的PT_LOAD字段要求被载入内存，这通常包含.text与.data字段，对于我们比较了解的x86来说，.text字段通常要求在0x0804_8000加载，因此loader会在loader这个ELF文件（executable）的时候请求在0x0804_8000映射内存，这个通常由一个mmap()调用达到目的。对于PPC来说，这个地址通常是0x1000_0000，.data字段通常在.text字段（连续）之后，当然ELF文件会要求load的时候被对齐（如对其到系统的页面大小4kb）。我们可以通过readelf -l /path/to/executable来获取相关信息，ELF entry通常就是_start函数开始的地址（当然是链接后的）。通过load_symbols_32()，qemu还加载了相应的.sym, .strtab字段。

函数load_elf() (load_elf_32)返回了@lowaddr与@highaddr，当一个ELF文件有多个PT_LOAD字段时，@lowaddr为所有映射字段地址里最低的，同理@highaddr为所有映射字段里面地址最高的结束为止 (addr + mem_size)。

与普通的loader不同的是，qemu loader无法将ELF文件要求映射的地址按其要求映射。qemu是一个普通的进程，可能无法再将ELF可执行文件映射到默认的entry地址（如主机为x86, 0x0804_8000已无法继续映射）。上面我们提到qemu模拟了目标机器的MMU（softmmu, 具有分页机制），因此类似一个正常的loader（通过mmap要求os映射到指定地址），我们需要请求qemu的MMU将目标ELF文件要求映射的地址做好映射。相关的工作由以下函数完成：

void cpu_physical_memory_write_rom(target_phys_addr_t addr,
                                   const uint8_t *buf, int len)
{
    int l;
    uint8_t *ptr;
    target_phys_addr_t page;
    unsigned long pd;
    PhysPageDesc *p;

    while (len > 0) {
        page = addr & TARGET_PAGE_MASK;
        l = (page + TARGET_PAGE_SIZE) - addr;
        if (l > len)
            l = len;
        p = phys_page_find(page >> TARGET_PAGE_BITS);
        if (!p) {
            pd = IO_MEM_UNASSIGNED;
        } else {
            pd = p->phys_offset;
        }

        if ((pd & ~TARGET_PAGE_MASK) != IO_MEM_RAM &&
            (pd & ~TARGET_PAGE_MASK) != IO_MEM_ROM &&
            !(pd & IO_MEM_ROMD)) {
            /* do nothing */
        } else {
            unsigned long addr1;
            addr1 = (pd & TARGET_PAGE_MASK) + (addr & ~TARGET_PAGE_MASK);
            /* ROM/RAM case */
            ptr = phys_ram_base + addr1;
            memcpy(ptr, buf, l);
        }
        len -= l;
        buf += l;
        addr += l;
    }
}

注意qemu仅仅映射了PT_LOAD字段，解析了符号表，返回了entry函数地址（以及设定@lowaddr/highaddr），但目前为止并未执行任何动作。

函数QEMUMachine->init (heathrow_init)在文件vl.c:main()中被调用(qemu 0.10.5, #5599)：

    machine->init(ram_size, vga_ram_size, boot_devices,
                  kernel_filename, kernel_cmdline, initrd_filename, cpu_model);
    current_machine = machine;

我们可能有点奇怪qemu加载的ELF文件（可能为linux kernel或是firmware）是在哪里执行的？ppc_oldworld.c:ppc_heathrow_init.c()中有两处调用了load_elf()，第一次加载firmware，第二次加载linux kernel（如果有-kernel选项的话）：

    /* Load OpenBIOS (ELF) */
    bios_size = load_elf(buf, 0, NULL, NULL, NULL);
    ...
    kernel_size = load_elf(kernel_filename, kernel_base, NULL, &lowaddr, NULL);

两次加载的entry_point都没有指定（同加载一个正常的用户空间ELF文件不一样）。那heathrow是如何启动起来的？回答这个问题之前我们需要了解一点CPU初始化的知识。由于不了解heathrow(oldmac, 740?)，以Freescale MPC85xx为例，CPU（指MPC85xx）上电的一刻，ip指向的位置为0xFFFF_FFFC（当然是虚拟地址，BookE PPC并没有所谓的“实”模式）；CPU默认的ROM地址为0xFF80_0000，也就是4G的最后8M，我们可以不全部使用这8M，如u-boot就只使用了最后的512KB。但如果想让firmware工作正常，我们需要在0xFFFF_FFFC（在boot rom中）放一条跳转指令。以u-boot为例，这个指令将跳转至0xFFFF_E000，即最后一页。这里我们需要特别小心：由于CPU刚上电，几乎一切都没有被初始化；并且对于BookE（如MPC85xx, PPC 44x）的PPC，默认地址转换（即MMU）处于开启状态，因此CPU必须（默认行为）在TLB寄存器里在存储最后一页的映射。我们开始能使用的地址空间（包括指令，数据）就只有这一页(4KB)。在正确的初始化完CPU之前，试图访问这一页之外的数据会触发Data TLB Error或Instruction TLB Error异常，但这时候异常向量表并未被正确的设置，结果是很显然的（更多信息会在后续的u-boot初始化分析中给出）。

回到ppc_oldworld.c，ppc_heathrow_init()中有如下调用：

    /* init CPUs */
    if (cpu_model == NULL)
        cpu_model = "G3";
    for (i = 0; i < smp_cpus; i++) {
        env = cpu_init(cpu_model);
        if (!env) {
            fprintf(stderr, "Unable to find PowerPC CPU definition\n");
            exit(1);
        }
        /* Set time-base frequency to 16.6 Mhz */
        cpu_ppc_tb_init(env, 16600000UL);
        env->osi_call = vga_osi_call;
        qemu_register_reset(&cpu_ppc_reset, env);
        envs[i] = env;
    }

注意函数ppc_init(const char* model)，这将调用cpu_ppc_init():

CPUPPCState *cpu_ppc_init (const char *cpu_model)
{
    CPUPPCState *env;
    const ppc_def_t *def;

    def = cpu_ppc_find_by_name(cpu_model);
    if (!def)
        return NULL;

    env = qemu_mallocz(sizeof(CPUPPCState));
    cpu_exec_init(env);
    ppc_translate_init();
    env->cpu_model_str = cpu_model;
    cpu_ppc_register_internal(env, def);
    cpu_ppc_reset(env);

    if (kvm_enabled())
        kvm_init_vcpu(env);

    return env;
}

cpu_ppc_find_by_name()将导致qemu搜索注册的ppc_def数组（target-ppc/translate_init.c，后面会继续分析这个文件）。这个数据定义了所有类型（qemu支持的）的PPC的属性（如指令兼容类型，MMU类型，异常类型等等），目前对我们最重要的是里面的init_proc()函数指针。

cpu_ppc_register_internal(env, def)会调用注册的这个init_proc()函数指针，对heathrow来说，这个函数是init_proc_740() (target-ppc/translate_init.c)。其中调用了后面我们会提到的函数：init_excp_7x0()。

cpu_exec_init()并为做太多（我们关心的）工作，ppc_translate_init()主要用于初始化qemu的后端（我们将host machine的环境定义为前端，qemu的中间环境定义为中端，target machine成为后端）的相关机器代码定义及寄存器。因此目前对我们来说更重要的是函数： cpu_ppc_reset()。

void cpu_ppc_reset (void *opaque)
{
    CPUPPCState *env = opaque;
    target_ulong msr;

    if (qemu_loglevel_mask(CPU_LOG_RESET)) {
        qemu_log("CPU Reset (CPU %d)\n", env->cpu_index);
        log_cpu_state(env, 0);
    }

    msr = (target_ulong)0;
    if (0) {
        /* XXX: find a suitable condition to enable the hypervisor mode */
        msr |= (target_ulong)MSR_HVB;
    }
    msr |= (target_ulong)0 << MSR_AP; /* TO BE CHECKED */
    msr |= (target_ulong)0 << MSR_SA; /* TO BE CHECKED */
    msr |= (target_ulong)1 << MSR_EP;
#if defined (DO_SINGLE_STEP) && 0
    /* Single step trace mode */
    msr |= (target_ulong)1 << MSR_SE;
    msr |= (target_ulong)1 << MSR_BE;
#endif
#if defined(CONFIG_USER_ONLY)
    msr |= (target_ulong)1 << MSR_FP; /* Allow floating point usage */
    msr |= (target_ulong)1 << MSR_VR; /* Allow altivec usage */
    msr |= (target_ulong)1 << MSR_SPE; /* Allow SPE usage */
    msr |= (target_ulong)1 << MSR_PR;
#else
    env->nip = env->hreset_vector | env->excp_prefix;
    if (env->mmu_model != POWERPC_MMU_REAL)
        ppc_tlb_invalidate_all(env);
#endif
    env->msr = msr & env->msr_mask;
    hreg_compute_hflags(env);
    env->reserve = (target_ulong)-1ULL;
    /* Be sure no exception or interrupt is pending */
    env->pending_interrupts = 0;
    env->exception_index = POWERPC_EXCP_NONE;
    env->error_code = 0;
    /* Flush all TLBs */
    tlb_flush(env, 1);
}

注意这几行：

    env->nip = env->hreset_vector | env->excp_prefix;
    if (env->mmu_model != POWERPC_MMU_REAL)
        ppc_tlb_invalidate_all(env);

其中env->hreset_vector与excp_prefix分别定义为：

static void init_excp_7x0 (CPUPPCState *env)
{
#if !defined(CONFIG_USER_ONLY)
    env->excp_vectors[POWERPC_EXCP_RESET]    = 0x00000100;
    env->excp_vectors[POWERPC_EXCP_MCHECK]   = 0x00000200;
    env->excp_vectors[POWERPC_EXCP_DSI]      = 0x00000300;
    env->excp_vectors[POWERPC_EXCP_ISI]      = 0x00000400;
    env->excp_vectors[POWERPC_EXCP_EXTERNAL] = 0x00000500;
    env->excp_vectors[POWERPC_EXCP_ALIGN]    = 0x00000600;
    env->excp_vectors[POWERPC_EXCP_PROGRAM] = 0x00000700;
    env->excp_vectors[POWERPC_EXCP_FPU]      = 0x00000800;
    env->excp_vectors[POWERPC_EXCP_DECR]     = 0x00000900;
    env->excp_vectors[POWERPC_EXCP_SYSCALL] = 0x00000C00;
    env->excp_vectors[POWERPC_EXCP_TRACE]    = 0x00000D00;
    env->excp_vectors[POWERPC_EXCP_PERFM]    = 0x00000F00;
    env->excp_vectors[POWERPC_EXCP_IABR]     = 0x00001300;
    env->excp_vectors[POWERPC_EXCP_SMI]      = 0x00001400;
    env->excp_vectors[POWERPC_EXCP_THERM]    = 0x00001700;
    env->excp_prefix = 0x00000000UL;
    /* Hardware reset vector */
    env->hreset_vector = 0xFFFFFFFCUL;
#endif
}

细心的读者可能会发现这里的excp_vector都是（虚）低地址，而CPU初始化的时候能访问的仅仅最后一页而已。注意函数cpu_ppc_reset()中用这么一行（对MPC85xx是MSR.MSR_IS）：
    msr |= (target_ulong)1 << MSR_EP;
这个表示发生exception时，exception vector会与上这个值，即最终的exception vector实际为 excp_vectors | ((MSR_EP? 0xFFFF_0000): 0x0000_0000)。因此CPU未完全初始化完成的时候（可能已经能使用超过最后4KB的限制，但RAM未必已经成功初始化，因此内存尚不可用，通常用L1 cache模拟内存），异常也可以正确的被处理。操作体统如Linux在自身初始化异常/中断的时候会将MSR.MSR_EP重置为0，因此Linux如果发生异常/中断，可以在低地址被处理（Linux开始加载的时候RAM已经完全可用了）。

（关于更多的细节，后续在分析u-boot初始化的时候会给出）

函数cpu_ppc_reset()最后做了一些类似善后的工作，如tlb flush，注意这里并没有cache flush/invalidate，这是因为qemu并不做cache模拟。

到目前为止还没有完全解释cpu_ppc_reset之后如何与firmware连接在一起，再次留意文件ppc_oldworld.c:ppc_heathrow_init()中的这一条语句：

    bios_size = load_elf(buf, 0, NULL, NULL, NULL);

并没有太多特殊的地方，不过可以相信的是load的这个firmware一定也是经过特殊处理过的（后续我们会分析u-boot，相对来说更清晰更容易理解）。

再次回到ppc_heathrow_init()函数，函数load_image()仅仅将所要求的文件全部载入缓冲区。

    ...
    /* Register 2 MB of ISA IO space */
    isa_mmio_init(0xfe000000, 0x00200000);

=>

void isa_mmio_init(target_phys_addr_t base, target_phys_addr_t size)
{
    if (!isa_mmio_iomemtype) {
        isa_mmio_iomemtype = cpu_register_io_memory(0, isa_mmio_read,
                                                    isa_mmio_write, NULL);
    }
    cpu_register_physical_memory(base, size, isa_mmio_iomemtype);
}

首先isa_mmio_init()调用了cpu_register_io_memory()分配了一个I/O区域的index，然后通过调用cpu_register_physical_memory()，注册内存区域@0xFE00_0000，size=2M到这个I/O MEM index。最重要的，将MMIO内存通过qemu softmmu注册到指定的区域。

    ...
    for (i = 0; i < smp_cpus; i++) {
        switch (PPC_INPUT(env)) {
        case PPC_FLAGS_INPUT_6xx:
            heathrow_irqs[i] = heathrow_irqs[0] + (i * 1);
            heathrow_irqs[i][0] =
                ((qemu_irq *)env->irq_inputs)[PPC6xx_INPUT_INT];
            break;
        default:
            cpu_abort(env, "Bus model not supported on OldWorld Mac machine\n");
            exit(1);
        }
    }

    /* init basic PC hardware */
    if (PPC_INPUT(env) != PPC_FLAGS_INPUT_6xx) {
        cpu_abort(env, "Only 6xx bus is supported on heathrow machine\n");
        exit(1);
    }
    pic = heathrow_pic_init(&pic_mem_index, 1, heathrow_irqs);

注意heathrow_irqs[i][0] = ((qemu_irq*)env->irq_inputs)[PPC6xx_INPUT_INT];这一行。PPC_INPUT_INT就是PPC处理器的外部中断（级联/cascade到了第一个heathrow PIC的最低中断位）。因此通过这种方式，我们将heathrow PIC挂到了PPC的外部中断之上。通过heathrow_pic_init()，初始化目标的中断处理例程，注意heathrow_pic_init()返回的是一个qemu_irq。

注意这段代码：
/* update the CPU irq state */
static void heathrow_pic_update(HeathrowPICS *s)
{
    if (check_irq(&s->pics[0]) || check_irq(&s->pics[1])) {
        qemu_irq_raise(s->irqs[0]);
    } else {
        qemu_irq_lower(s->irqs[0]);
    }
}

其中s->irqs为heathrow的所有PIC中断向量，包含两个PIC控制器，共支持64个中断，s->irqs[0]即为最低位的中断，亦即级联到CPU中断控制器的INT中断的那一位；heathrow_pic_update()会分发中断至上一层的中断控制器。heathrow_pic_init()之后，中断处理大概可以表示为下图：

+------+------+------+------+-----+
| HRST | SRST | ... | INT | ... |
+------+------+------+------+-----+
                        |
                     +------+------+-----+------+
                     |PIC 0 |PIC 1 | ... |PIC 63|
                     +------+------+-----+------+

当qemu_irq_raise()/qemu_irq_lower()的时候，相应的中断事件会被cascade的内部中断控制器处理，见函数hw/ppc.c:ppc6xx_set_irq()：
    ...

        case PPC6xx_INPUT_INT:
            /* Level sensitive - active high */
            LOG_IRQ("%s: set the external IRQ state to %d\n",
                        __func__, level);
            ppc_set_irq(env, PPC_INTERRUPT_EXT, level);
    ...

qemu_irq *heathrow_pic_init(int *pmem_index,
                            int nb_cpus, qemu_irq **irqs)
{
    HeathrowPICS *s;

    s = qemu_mallocz(sizeof(HeathrowPICS));
    /* only 1 CPU */
    s->irqs = irqs[0];
    *pmem_index = cpu_register_io_memory(0, pic_read, pic_write, s);

    register_savevm("heathrow_pic", -1, 1, heathrow_pic_save,
                    heathrow_pic_load, s);
    qemu_register_reset(heathrow_pic_reset, s);
    heathrow_pic_reset(s);
    return qemu_allocate_irqs(heathrow_pic_set_irq, s, 64);
}

（这里再次调用了cpu_register_io_memory()分配了一个IO MEM index。）

qemu_register_reset()注册了中断控制器的reset()函数。并通过显示调用heathrow_pic_reset()，初始化了（两个）PIC中断控制器。注意传递进来的@irqs为前面的heathrow_irqs，这个从env->irq_inputs中拷贝而来，而env->irq_inputs在调用cpu_ppc_init()=>init_proc_750()=>ppc6xx_irq_init()时被初始化。（target-ppc/translate_init.c:init_proc_750())。

static void heathrow_pic_reset(void *opaque)
{
    HeathrowPICS *s = opaque;

    heathrow_pic_reset_one(&s->pics[0]);
    heathrow_pic_reset_one(&s->pics[1]);

    s->pics[0].level_triggered = 0;
    s->pics[1].level_triggered = 0x1ff00000;
}

由此我们也可以注意到PIC 0均为level triggered，PIC1的有9（可能是最后9个）个不是level triggered（如edge triggered，详情请参见hw/heathrow_pic.c）。
最后heathrow_pic_init()调用了qemu_allocate_irqs()分配了qemu的（虚拟）IRQ。

qemu虚拟的设备如ne2k_pci(hw/ne2000.c)在产生中断时调用qemu_set_irq()，由于我们调用了qemu_allocate_irqs，因此最终调用到了相应中断控制器（heathrow PIC）的代码，从而完成了对外部中断的虚拟。

后面涉及的vga与相关PCI，IDE驱动目前我们不予讨论。

（原创文章，未经作者同意，请勿转载，谢谢合作）

（未完待续）

阅读(7859) | 评论(0) | 转发(3) |

上一篇：Using ELF section to gathering data

下一篇：Simple example for ppc (gnu-linux) Stack backtrace

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6