Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1270610
  • 博文数量: 404
  • 博客积分: 10011
  • 博客等级: 上将
  • 技术积分: 5382
  • 用 户 组: 普通用户
  • 注册时间: 2008-09-03 16:29
文章存档

2010年(40)

2009年(140)

2008年(224)

我的朋友

分类: LINUX

2008-09-26 10:23:16

本文主要从内核实现的角度分析Linux 2.4.0内核IO子系统中对IO端口资源的管理的实现原理。本文是为那些想要深入分析LinuxIO子系统的读者和设备驱动程序开发人员而写的。

几乎每一种外设都是通过读写设备上的寄存器来进行的。外设寄存器也称为“I/O端口,通常包括:控制寄存器、状态寄存器和数据寄存器三大类,而且一个外设的寄存器通常被连续地编址。CPU对外设IO端口物理地址的编址方式有两种:一种是I/O映射方式(I/Omapped),另一种是内存映射方式(Memory mapped)。而具体采用哪一种则取决于CPU的体系结构。

有些体系结构的CPU (如,PowerPCm68k等)通常只实现一个物理地址空间(RAM)。在这种情况下,外设I/O端口的物理地址就被映射到CPU的单一物理地址空间中,而成为内存的一部分。此时,CPU可象访问一个内存单元那样访问外设I/O端口,而不需要设立专门的外设I/O指令。这就是所谓的内存映射方式Memorymapped)。

而另外一些体系结构的 CPU(典型地如X86)则为外设专门实现了一个单独地地址空间,称为“I/O地址空间或者“I/O端口空间。这是一个与CPURAM物理地址空间不同的地址空间,所有外设的I/O端口均在这一空间中进行编址。CPU通过设立专门的I/O指令(如X86INOUT指令)来访问这一空间中的地址单元(也即I/O端口)。这就是所谓的“I/O映射方式I/Omapped)。与RAM物理地址空间相比,I/O地址空间通常都比较小,如x86 CPUI/O空间就只有64KB00xffff)。这是“I/O映射方式的一个主要缺点。

Linux将基于I/O映射方式的或内存映射方式的I/O端口通称为“I/O区域I/O region)。在讨论对I/O区域的管理之前,我们首先来分析一下Linux是如何实现“I/O资源这一抽象概念的。

LinuxI/O资源的描述

Linux设计了一个通用的数据结构resource来描述各种I/O资源(如:I/O端口、外设内存、DMAIRQ等)。该结构定义在include/linux/ioport.h头文件中:

  struct resource {

    const char *name;

    unsigned long start, end;

    unsigned long flags;

    struct resource *parent, *sibling, *child;

  };

各成员的含义如下:

1. name指针:指向此资源的名称。

2. startend:表示资源的起始物理地址和终止物理地址。它们确定了资源的范围,也即是一个闭区间[start,end]

3. flags:描述此资源属性的标志(见下面)。

4. 指针parentsiblingchild:分别为指向父亲、兄弟和子资源的指针。

属性flags是一个unsigned long类型的32位标志值,用以描述资源的属性。比如:资源的类型、是否只读、是否可缓存,以及是否已被占用等。下面是一部分常用属性标志位的定义(ioport.h):

/*

 * IO resources have these defined flags.

 */

#define IORESOURCE_BITS        0x000000ff    /* Bus-specific bits */

 

#define IORESOURCE_IO        0x00000100    /* Resource type */

#define IORESOURCE_MEM        0x00000200

#define IORESOURCE_IRQ        0x00000400

#define IORESOURCE_DMA        0x00000800

 

#define IORESOURCE_PREFETCH    0x00001000    /* No side effects */

#define IORESOURCE_READONLY    0x00002000

#define IORESOURCE_CACHEABLE    0x00004000

#define IORESOURCE_RANGELENGTH    0x00008000

#define IORESOURCE_SHADOWABLE    0x00010000

#define IORESOURCE_BUS_HAS_VGA    0x00080000

 

#define IORESOURCE_UNSET    0x20000000

#define IORESOURCE_AUTO        0x40000000

#define IORESOURCE_BUSY        0x80000000

    /* Driver has marked this resource busy */

指针parentsiblingchild的设置是为了以一种树的形式来管理各种I/O资源。

LinuxI/O资源的管理

Linux是以一种倒置的树形结构来管理每一类I/O资源(如:I/O端口、外设内存、DMAIRQ)的。每一类I/O资源都对应有一颗倒置的资源树,树中的每一个节点都是一个resource结构,而树的根结点root则描述了该类资源的整个资源空间。

基于上述这个思想,Linuxkernel/Resource.c文件中实现了对资源的申请、释放及查找等操作。

1 I/O资源的申请

假设某类资源有如下这样一颗资源树:

节点rootr1r2 r3实际上都是一个resource结构类型。子资源 r1r2r3通过sibling指针链接成一条单向非循环链表,其表头由root节点中的child指针定义,因此也称为父资源的子资源链表。r1 r2r3parent指针均指向他们的父资源节点,在这里也就是图中的root节点。

假设想在root节点中分配一段I/O资源(由图中的阴影区域表示)。函数 request_resource()实现这一功能。它有两个参数:①root指针,表示要在哪个资源根节点中进行分配;②new指针,指向描述所要分配的资源(即图中的阴影区域)的resource结构。该函数的源代码如下(kernel/resource.c:

  int request_resource(struct resource *root, struct resource *new)

  {

    struct resource *conflict;

 

    write_lock(&resource_lock);

    conflict = __request_resource(root, new);

    write_unlock(&resource_lock);

    return conflict ? -EBUSY : 0;

  }

对上述函数的NOTE如下:

资源锁resource_lock对所有资源树进行读写保护,任何代码段在访问某一颗资源树之前都必须先持有该锁。其定义如下(kernel/Resource.c):

static rwlock_t resource_lock = RW_LOCK_UNLOCKED;

可以看出,函数实际上是通过调用内部静态函数__request_resource()来完成实际的资源分配工作。如果该函数返回非空指针,则表示有资源冲突;否则,返回NULL就表示分配成功。

最后,如果conflict指针为NULL,则request_resource()函数返回返回值0,表示成功;否则返回-EBUSY表示想要分配的资源已被占用。

函数__request_resource()完成实际的资源分配工作。如果参数new所描述的资源中的一部分或全部已经被其它节点所占用,则函数返回与new相冲突的resource结构的指针。否则就返回NULL。该函数的源代码如下

kernel/Resource.c):

/* Return the conflict entry if you can't request it */

static struct resource * __request_resource

  (struct resource *root, struct resource *new)

{

    unsigned long start = new->start;

    unsigned long end = new->end;

    struct resource *tmp, **p;

 

    if (end < start)

        return root;

    if (start < root->start)

        return root;

    if (end > root->end)

        return root;

    p = &root->child;

    for (;;) {

        tmp = *p;

        if (!tmp || tmp->start > end) {

            new->sibling = tmp;

            *p = new;

            new->parent = root;

            return NULL;

        }

        p = &tmp->sibling;

        if (tmp->end < start)

            continue;

        return tmp;

    }

}

对函数的NOTE

前三个if语句判断new所描述的资源范围是否被包含在root内,以及是否是一段有效的资源(因为end必须大于start)。否则就返回root指针,表示与根结点相冲突。

接下来用一个for循环遍历根节点rootchild链表,以便检查是否有资源冲突,并将new插入到child链表中的合适位置(child链表是以I/O资源物理地址从低到高的顺序排列的)。为此,它用tmp指针指向当前正被扫描的resource结构,用指针p指向前一个resource结构的sibling指针成员变量,p的初始值为指向root>sibling For循环体的执行步骤如下:

tmp指向当前正被扫描的resource结构(tmp*p)。判断tmp指针是否为空(tmp指针为空说明已经遍历完整个child链表),或者当前被扫描节点的起始位置 start是否比new的结束位置end还要大。只要这两个条件之一成立的话,就说明没有资源冲突,于是就可以把new链入child链表中:设置 newsibling指针指向当前正被扫描的节点tmp new->sibling=tmp);当前节点tmp的前一个兄弟节点的sibling指针被修改为指向new这个节点(*p=new); newparent指针设置为指向root。然后函数就可以返回了(返回值NULL表示没有资源冲突)。

如果上述两个条件都不成立,这说明当前被扫描节点的资源域有可能与new相冲突(实际上就是两个闭区间有交集),因此需要进一步判断。为此它首先修改指针p,让它指向tmp- >sibling,以便于继续扫描child链表。然后,判断 tmp->end是否小于new->start,如果小于,则说明当前节点tmpnew没有资源冲突,因此执行continue语句,继续向下扫描child链表。否则,如果tmp->end大于或等于new->start,则说明tmp->[start,end] new->[start,end]之间有交集。所以返回当前节点的指针tmp,表示发生资源冲突。

2 资源的释放

函数release_resource()用于实现I/O资源的释放。该函数只有一个参数——即指针old,它指向所要释放的资源。起源代码如下:

int release_resource(struct resource *old)

{

    int retval;

 

    write_lock(&resource_lock);

    retval = __release_resource(old);

    write_unlock(&resource_lock);

    return retval;

}

可以看出,它实际上通过调用__release_resource()这个内部静态函数来完成实际的资源释放工作。函数__release_resource()的主要任务就是将资源区域old(如果已经存在的话)从其父资源的child链表重摘除,它的源代码如下:

static int __release_resource(struct resource *old)

{

    struct resource *tmp, **p;

 

    p = &old->parent->child;

    for (;;) {

        tmp = *p;

        if (!tmp)

            break;

        if (tmp == old) {

            *p = tmp->sibling;

            old->parent = NULL;

            return 0;

        }

        p = &tmp->sibling;

    }

    return -EINVAL;

}

对上述函数代码的NOTE如下:

同函数__request_resource()相类似,该函数也是通过一个for 循环来遍历父资源的child链表。为此,它让tmp指针指向当前被扫描的资源,而指针p则指向当前节点的前一个节点的sibling成员(p的初始值为指向父资源的child指针)。循环体的步骤如下:

首先,让tmp指针指向当前被扫描的节点(tmp*p)。

如果tmp指针为空,说明已经遍历完整个child链表,因此执行break语句推出for循环。由于在遍历过程中没有在child链表中找到参数old所指定的资源节点,因此最后返回错误值-EINVAL,表示参数old是一个无效的值。

接下来,判断当前被扫描节点是否就是参数old所指定的资源节点。如果是,那就将 oldchild链表中去除,也即让当前结点tmp的前一个兄弟节点的sibling指针指向tmp的下一个节点,然后将old>parent 指针设置为NULL。最后返回0值表示执行成功。

如果当前被扫描节点不是资源old,那就继续扫描child链表中的下一个元素。因此将指针p指向tmp>sibling成员。

3 检查资源是否已被占用

函数check_resource()用于实现检查某一段I/O资源是否已被占用。其源代码如下:

int check_resource(struct resource *root, unsigned long start, unsigned long len)

{

    struct resource *conflict, tmp;

 

    tmp.start = start;

    tmp.end = start + len - 1;

    write_lock(&resource_lock);

    conflict = __request_resource(root, &tmp);

    if (!conflict)

        __release_resource(&tmp);

    write_unlock(&resource_lock);

    return conflict ? -EBUSY : 0;

}

对该函数的NOTE如下:

构造一个临时资源tmp,表示所要检查的资源[start,start+end-1]

调用__request_resource()函数在根节点root申请tmp所表示的资源。如果tmp所描述的资源还被人使用,则该函数返回NULL,否则返回非空指针。因此接下来在conflictNULL的情况下,调用 __release_resource()将刚刚申请的资源释放掉。

最后根据conflict是否为NULL,返回-EBUSY0值。

4 寻找可用资源

函数find_resource()用于在一颗资源树中寻找未被使用的、且满足给定条件的(也即资源长度大小为size,且在[min,max]区间内)的资源。其函数源代码如下:

/*

 * Find empty slot in the resource tree given range and alignment.

 */

static int find_resource(struct resource *root, struct resource *new,

          unsigned long size,

          unsigned long min, unsigned long max,

          unsigned long align,

          void (*alignf)(void *, struct resource *, unsigned long),

          void *alignf_data)

{

    struct resource *this = root->child;

 

    new->start = root->start;

    for(;;) {

        if (this)

            new->end = this->start;

        else

            new->end = root->end;

        if (new->start < min)

            new->start = min;

        if (new->end > max)

            new->end = max;

        new->start = (new->start + align - 1) & ~(align - 1);

        if (alignf)

            alignf(alignf_data, new, size);

        if (new->start < new->end && new->end - new->start + 1 >= size)

                  {

            new->end = new->start + size - 1;

            return 0;

        }

        if (!this)

            break;

        new->start = this->end + 1;

        this = this->sibling;

    }

    return -EBUSY;

}

对该函数的NOTE如下:

同样,该函数也要遍历rootchild链表,以寻找未被使用的资源空洞。为此,它让 this指针表示当前正被扫描的子资源节点,其初始值等于root->child,即指向child链表中的第一个节点,并让new-> start的初始值等于root->start,然后用一个for循环开始扫描child链表,对于每一个被扫描的节点,循环体执行如下操作:

首先,判断this指针是否为NULL。如果不为空,就让new->end等于this->start,也即让资源new表示当前资源节点this前面那一段未使用的资源区间。

如果this指针为空,那就让new->end等于root-> end。这有两层意思:第一种情况就是根结点的child指针为NULL(即根节点没有任何子资源)。因此此时先暂时将new->end放到最大。第二种情况就是已经遍历完整个child链表,所以此时就让new表示最后一个子资源后面那一段未使用的资源区间。

根据参数minmax修正new->[start,end]的值,以使资源new被包含在[min,max]区域内。

接下来进行对齐操作。

然后,判断经过上述这些步骤所形成的资源区域new是否是一段有效的资源(end 必须大于或等于start),而且资源区域的长度满足size参数的要求(endstart1>=size)。如果这两个条件均满足,则说明我们已经找到了一段满足条件的资源空洞。因此在对new->end的值进行修正后,然后就可以返回了(返回值0表示成功)。

如果上述两条件不能同时满足,则说明还没有找到,因此要继续扫描链表。在继续扫描之前,我们还是要判断一下this指针是否为空。如果为空,说明已经扫描完整个child链表,因此就可以推出for循环了。否则就将new-> start的值修改为this->end+1,并让this指向下一个兄弟资源节点,从而继续扫描链表中的下一个子资源节点。

5 分配接口allocate_resource()

find_resource()函数的基础上,函数allocate_resource()实现:在一颗资源树中分配一条指定大小的、且包含在指定区域[min,max]中的、未使用资源区域。其源代码如下:

/*

 * Allocate empty slot in the resource tree given range and alignment.

 */

int allocate_resource(struct resource *root, struct resource *new,

              unsigned long size,

              unsigned long min, unsigned long max,

              unsigned long align,

              void (*alignf)(void *, struct resource *, unsigned long),

              void *alignf_data)

{

    int err;

 

    write_lock(&resource_lock);

    err = find_resource(root, new, size, min, max, align, alignf, alignf_data);

    if (err >= 0 && __request_resource(root, new))

    err = -EBUSY;

    write_unlock(&resource_lock);

    return err;

}

6 获取资源的名称列表

函数get_resource_list()用于获取根节点root的子资源名字列表。该函数主要用来支持/proc/文件系统(比如实现proc/ioports文件和/proc/iomem文件)。其源代码如下:

int get_resource_list(struct resource *root, char *buf, int size)

{

    char *fmt;

    int retval;

 

    fmt = "        %08lx-%08lx : %s

";

    if (root->end < 0x10000)

        fmt = "        %04lx-%04lx : %s

";

    read_lock(&resource_lock);

    retval = do_resource_list(root->child, fmt, 8, buf, buf + size) - buf;

    read_unlock(&resource_lock);

    return retval;

}

可以看出,该函数主要通过调用内部静态函数do_resource_list()来实现其功能,其源代码如下:

/*

 * This generates reports for /proc/ioports and /proc/iomem

 */

static char * do_resource_list(struct resource *entry, const char *fmt,

  int offset, char *buf, char *end)

{

    if (offset < 0)

        offset = 0;

 

    while (entry) {

        const char *name = entry->name;

        unsigned long from, to;

 

        if ((int) (end-buf) < 80)

            return buf;

 

        from = entry->start;

        to = entry->end;

        if (!name)

            name = "";

 

        buf += sprintf(buf, fmt + offset, from, to, name);

        if (entry->child)

           buf = do_resource_list(entry->child, fmt, offset-2, buf, end);

        entry = entry->sibling;

    }

 

    return buf;

}

函数do_resource_list()主要通过一个while{}循环以及递归嵌套调用来实现,较为简单,这里就不在详细解释了。

阅读(802) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~