A.几乎每一种外设都是通过读写设备上的寄存器来进行的。外设寄存器也称为“I/O端口”,通常包括:控制寄存器、状态寄存器和数据寄存器三大类,而且一个外设的寄存器通常被连续地编址。CPU对外设IO端口物理地址的编址方式有两种:一种是I/O映射方式(I/O-mapped),另一种是内存映射方式(Memory-mapped)。而具体采用哪一种则取决于CPU的体系结构。
有些体系结构的CPU(如,PowerPC、m68k等)通常只实现一个物理地址空间(RAM)。在这种情况下,外设I/O端口的物理地址就被映射到CPU的单一物理地址空间中,而成为内存的一部分。此时,CPU可以象访问一个内存单元那样访问外设I/O端口,而不需要设立专门的外设I/O指令。这就是所谓的“内存映射方式”(Memory-mapped)。
而另外一些体系结构的CPU(典型地如X86)则为外设专门实现了一个单独地地址空间,称为“I/O地址空间”或者“I/O端口空间”。这是一个与CPU地RAM物理地址空间不同的地址空间,所有外设的I/O端口均在这一空间中进行编址。CPU通过设立专门的I/O指令(如X86的IN和OUT指令)来访问这一空间中的地址单元(也即I/O端口)。这就是所谓的“I/O映射方式”(I/O-mapped)。与RAM物理地址空间相比,I/O地址空间通常都比较小,如x86 CPU的I/O空间就只有64KB(0-0xffff)。这是“I/O映射方式”的一个主要缺点。
Linux将基于I/O映射方式的或内存映射方式的I/O端口通称为“I/O区域”(I/O region)。在讨论对I/O区域的管理之前,我们首先来分析一下Linux是如何实现“I/O资源”这一抽象概念的.
B.
在驱动程序编写过程中,很少会注意到IO Port和IO Mem的区别。虽然使用一些不符合规范的代码可以达到最终目的,这是极其不推荐使用的。
结合下图,我们彻底讲述IO端口和IO内存以及内存之间的关系。主存16M字节的SDRAM,外设是个视频采集卡,上面有16M字节的SDRAM作为缓冲区。
1. CPU是i386架构的情况
在i386系列的处理中,内存和外部IO是独立编址,也是独立寻址的。MEM的内存空间是32位可以寻址到4G,IO空间是16位可以寻址到64K。
在Linux内核中,访问外设上的IO Port必须通过IO Port的寻址方式。而访问IO Mem就比较罗嗦,外部MEM不能和主存一样访问,虽然大小上不相上下,可是外部MEM是没有在系统中注册的。访问外部IO MEM必须通过remap映射到内核的MEM空间后才能访问。
为了达到接口的同一性,内核提供了IO Port到IO Mem的映射函数。映射后IO Port就可以看作是IO Mem,按照IO Mem的访问方式即可。
2. CPU是ARM 或PPC架构的情况
在这一类的嵌入式处理器中,IO Port的寻址方式是采用内存映射,也就是IO bus就是Mem bus。系统的寻址能力如果是32位,IO Port+Mem(包括IO Mem)可以达到4G。
访问这类IO Port时,我们也可以用IO Port专用寻址方式。至于在对IO Port寻址时,内核是具体如何完成的,这个在内核移植时就已经完成。在这种架构的处理器中,仍然保持对IO Port的支持,完全是i386架构遗留下来的问题,在此不多讨论。而访问IO Mem的方式和i386一致。
注意:linux内核给我提供了完全对IO Port和IO Mem的支持,然而具体去看看driver目录下的驱动程序,很少按照这个规范去组织IO Port和IO Mem资源。对这二者访问最关键问题就是地址的定位,在C语言中,使用volatile 就可以实现。很多的代码访问IO Port中的寄存器时,就使用volatile关键字,虽然功能可以实现,我们还是不推荐使用。就像最简单的延时莫过于while,可是在多任务的系统中是坚决避免的!
一般来说,在系统运行时,外设的I/O内存资源的物理地址是已知的,由硬件的设计决定。但是CPU通常并没有为这些已知的外设I/O内存资源的物理地址预定义虚拟地址范围,驱动程序并不能直接通过物理地址访问I/O内存资源,而必须将它们映射到核心虚地址空间内(通过页表),然后才能根据映射所得到的核 心虚地址范围,通过访内指令访问这些I/O内存资源。Linux在io.h头文件中声明了函数ioremap(),用来将I/O内存资源的物理地址映射到 核心虚地址空间(3GB-4GB)中。
1.对IO端口的操作:
申请->访问->释放
申请 :request_region
访问:
8位 读 intb 写 outb
16位 intw outw
32位 intl outl
释放:release_region
2.对IO内存的操作:
申请->映射->访问->释放
申请:request_mem_region 申请到的是物理地址
映射:ioremap 将申请到的物理地址映射成虚拟地址
访问:ioread8 iowrite8
ioread16 iowrite16
ioread32 iowrite32
释放:
iounmap
release_mem_region
CPU对外设端口物理地址的编址方式有两种:一种是IO映射方式,另一种是内存映射方式。
Linux将基于IO映射方式的和内存映射方式的IO端口统称为IO区域(IO region)。
IO region仍然是一种IO资源,因此它仍然可以用resource结构类型来描述。
Linux管理IO region:
1) request_region()
把一个给定区间的IO端口分配给一个IO设备。
2) check_region()
检查一个给定区间的IO端口是否空闲,或者其中一些是否已经分配给某个IO设备。
3) release_region()
释放以前分配给一个IO设备的给定区间的IO端口。
Linux中可以通过以下辅助函数来访问IO端口:
inb(),inw(),inl(),outb(),outw(),outl()
“b”“w”“l”分别代表8位,16位,32位。
对IO内存资源的访问
1) request_mem_region()
请求分配指定的IO内存资源。
2) check_mem_region()
检查指定的IO内存资源是否已被占用。
3) release_mem_region()
释放指定的IO内存资源。
其中传给函数的start address参数是内存区的物理地址(以上函数参数表已省略)。
驱动开发人员可以将内存映射方式的IO端口和外设内存统一看作是IO内存资源。
ioremap()用来将IO资源的物理地址映射到内核虚地址空间(3GB -
4GB)中,参数addr是指向内核虚地址的指针。
Linux中可以通过以下辅助函数来访问IO内存资源:
readb(),readw(),readl(),writeb(),writew(),writel()。
Linux在kernel/resource.c文件中定义了全局变量ioport_resource和
iomem_resource,来分别描述基于IO映射方式的整个IO端口空间和基于内存映射方式的IO内存资源空间(包括IO端口和外设内存)。
C. Linux对I/O资源的描述
3.1 Linux对I/O资源的描述
Linux设计了一个通用的数据结构resource来描述各种I/O资源(如:I
/O端口、外设内存、DMA和IRQ等)。该结构定义在include/linux/ioport.h头文件中:
struct
resource {
const char *name;
unsigned long start, end;
unsigned long flags;
struct resource *parent, *sibling,
*child;
};
各成员的含义如下:
1. name指针:指向此资源的名称。
2.
start和end:表示资源的起始物理地址和终止物理地址。他们确定了资源的范围,也即是个闭区间[start,end]。
3.
flags:描述此资源属性的标志(见下面)。
4. 指针parent、sibling和child:分别为指向父亲、兄弟和子资源的指针。
属性flags是个unsigned
long类型的32位标志值,用以描述资源的属性。比如:资源的类型、是否只读、是否可缓存,及是否已被占用等。下面是一部分常用属性标志位的定义
(ioport.h):
/*
* IO resources have these defined flags.
*/
#define
IORESOURCE_BITS 0x000000ff /* Bus-specific bits */
#define
IORESOURCE_IO 0x00000100 /* Resource type */
#define
IORESOURCE_MEM 0x00000200
#define IORESOURCE_IRQ
0x00000400
#define IORESOURCE_DMA 0x00000800
#define
IORESOURCE_PREFETCH 0x00001000 /* No side effects */
#define
IORESOURCE_READONLY 0x00002000
#define IORESOURCE_CACHEABLE
0x00004000
#define IORESOURCE_RANGELENGTH 0x00008000
#define
IORESOURCE_SHADOWABLE 0x00010000
#define IORESOURCE_BUS_HAS_VGA
0x00080000
#define IORESOURCE_UNSET 0x20000000
#define
IORESOURCE_AUTO 0x40000000
#define IORESOURCE_BUSY
0x80000000
/* Driver has marked this resource busy */
指针
parent、sibling和child的设置是为了以一种树的形式来管理各种I/O资源。
3.2 Linux对I/O资源的管理
Linux是以一种倒置的树形结构来管理每一类I/O资源(如:I/O端口、外设内存、DMA和IRQ)的。每一类I/O资源都对应有一颗倒置的资源树,
树中的每一个节点都是个resource结构,而树的根结点root则描述了该类资源的整个资源空间。
基于上述这个思想,Linux在
kernel/Resource.c文件中实现了对资源的申请、释放及查找等操作。
3.2.1 I/O资源的申请
假设某类资源有
如下这样一颗资源树:
节点root、r1、r2和r3实际上都是个resource结构类型。子资源r1、r2和r3通过sibling指针
链接成一条单向非循环链表,其表头由root节点中的child指针定义,因此也称为父资源的子资源链表。r1、r2和r3的parent指针均指向他们
的父资源节点,在这里也就是图中的root节点。
假设想在root节点中分配一段I/O资源(由图中的阴影区域表示)。函数
request_resource()实现这一功能。他有两个参数:①root指针,表示要在哪个资源根节点中进行分配;②new指针,指向描述所要分配
的资源(即图中的阴影区域)的resource结构。该函数的原始码如下(kernel/resource.c):
int
request_resource(struct resource *root, struct resource *new)
{
struct resource *conflict;
write_lock(&resource_lock);
conflict =
__request_resource(root, new);
write_unlock(&resource_lock);
return conflict ? -EBUSY : 0;
}
对上述函数的NOTE如下:
①资源锁resource_lock对所有资源树进行读写保护,所有代码段在访问某一颗资源树之
前都必须先持有该锁。其定义如下(kernel/Resource.c):
static rwlock_t
resource_lock = RW_LOCK_UNLOCKED;
②能看出,函数实际上是通过调用内部静态函数
__request_resource()来完成实际的资源分配工作。如果该函数返回非空指针,则表示有资源冲突;否则,返回NULL就表示分配成功。
③最后,如果conflict指针为NULL,则request_resource()函数返回返回值0,表示成功;否则返回-EBUSY表示想要分配
的资源已被占用。
函数__request_resource()完成实际的资源分配工作。如果参数new所描述的资源中的一部分或全部已被其
他节点所占用,则函数返回和new相冲突的resource结构的指针。否则就返回NULL。该函数的原始码如下
(kernel/Resource.c):
/*
Return the conflict entry if you can’t request it */
static struct
resource * __request_resource
(struct resource *root, struct
resource *new)
{
unsigned long start = new->start;
unsigned long end = new->end;
struct resource *tmp, **p;
if (end
return root;
if (start start)
return root;
if (end > root->end)
return root;
p = &root->child;
for
(;;) {
tmp = *p;
if (!tmp ||
tmp->start > end) {
new->sibling =
tmp;
*p = new;
new->parent = root;
return NULL;
}
p = &tmp->sibling;
if (tmp->end
continue;
return tmp;
}
}
对函数的NOTE:
①前三个if语句判断new所描述的
资源范围是否被包含在root内,及是否是一段有效的资源(因为end必须大于start)。否则就返回root指针,表示和根结点相冲突。
②接下来用一个for循环遍历根节点root的child链表,以便检查是否有资源冲突,并将new插入到child链表中的合适位置(child链表是
以I/O资源物理地址从低到高的顺序排列的)。为此,他用tmp指针指向当前正被扫描的resource结构,用指针p指向前一个resource结构的
sibling指针成员变量,p的初始值为指向root->sibling。For循环体的执行步骤如下:
l
让tmp指向当前正被扫描的resource结构(tmp=*p)。
l
判断tmp指针是否为空(tmp指针为空说明已遍历完整个child链表),或当前被扫描节点的起始位置start是否比new的结束位置end还要大。
只要这两个条件之一成立的话,就说明没有资源冲突,于是就能把new链入child链表中:①设置new的sibling指针指向当前正被扫描的节点
tmp(new->sibling=tmp);②当前节点tmp的前一个兄弟节点的sibling指针被修改为指向new这个节点
(*p=new);③将new的parent指针设置为指向root。然后函数就能返回了(返回值NULL表示没有资源冲突)。
l
如果上述两个条件都不成立,这说明当前被扫描节点的资源域有可能和new相冲突(实际上就是两个闭区间有交集),因此需要进一步判断。为此他首先修改指针
p,让他指向tmp->sibling,以便于继续扫描child链表。然后,判断tmp->end是否小于new->start,如
果小于,则说明当前节点tmp和new没有资源冲突,因此执行continue语句,继续向下扫描child链表。否则,如果tmp->end大于
或等于new->start,则说明tmp->[start,end]和new->[start,end]之间有交集。所以返回当前节
点的指针tmp,表示发生资源冲突。
3.2.2 资源的释放
函数release_resource()用于实现I/O资源的释
放。该函数只有一个参数??即指针old,他指向所要释放的资源。起原始码如下:
int
release_resource(struct resource *old)
{
int retval;
write_lock(&resource_lock);
retval =
__release_resource(old);
write_unlock(&resource_lock);
return retval;
}
能看出,他实际上通过调用__release_resource()这个内部静态函数来完成
实际的资源释放工作。函数__release_resource()的主要任务就是将资源区域old(如果已存在的话)从其父资源的child链表重摘
除,他的原始码如下:
static int __release_resource(struct resource *old)
{
struct resource *tmp, **p;
p =
&old->parent->child;
for (;;) {
tmp = *p;
if (!tmp)
break;
if (tmp == old) {
*p = tmp->sibling;
old->parent = NULL;
return 0;
}
p = &tmp->sibling;
}
return -EINVAL;
}
对上述函数代码的NOTE如下:
同函数__request_resource()相类似,该函数也是通过一个for循环来遍历父资源的
child链表。为此,他让tmp指针指向当前被扫描的资源,而指针p则指向当前节点的前一个节点的sibling成员(p的初始值为指向父资源的
child指针)。循环体的步骤如下:
①首先,让tmp指针指向当前被扫描的节点(tmp=*p)。
②如果tmp指针为空,说明
已遍历完整个child链表,因此执行break语句推出for循环。由于在遍历过程中没有在child链表中找到参数old所指定的资源节点,因此最后
返回错误值-EINVAL,表示参数old是个无效的值。
③接下来,判断当前被扫描节点是否就是参数old所指定的资源节点。如果是,那就将
old从child链表中去除,也即让当前结点tmp的前一个兄弟节点的sibling指针指向tmp的下一个节点,然后将old->parent
指针设置为NULL。最后返回0值表示执行成功。
④如果当前被扫描节点不是资源old,那就继续扫描child链表中的下一个元素。因此将指
针p指向tmp->sibling成员。
3.2.3 检查资源是否已被占用,
函数check_resource()用于实
现检查某一段I/O资源是否已被占用。其原始码如下:
int check_resource(struct resource
*root, unsigned long start, unsigned long len)
{
struct
resource *conflict, tmp;
tmp.start = start;
tmp.end = start + len - 1;
write_lock(&resource_lock);
conflict = __request_resource(root, &tmp);
if
(!conflict)
__release_resource(&tmp);
write_unlock(&resource_lock);
return conflict ? -EBUSY : 0;
}
对该函数的NOTE如下:
①构造一个临时资源tmp,表示所要检查的资源[start,start+end-1]。
②调用
__request_resource()函数在根节点root申请tmp所表示的资源。如果tmp所描述的资源还被人使用,则该函数返回NULL,否则
返回非空指针。因此接下来在conflict为NULL的情况下,调用__release_resource()将刚刚申请的资源释放掉。
③
最后根据conflict是否为NULL,返回-EBUSY或0值。
3.2.4 寻找可用资源
函数
find_resource()用于在一颗资源树中寻找未被使用的、且满足给定条件的(也即资源长度大小为size,且在[min,max]区间内)的资
源。其函数原始码如下:
/*
* Find empty slot in the resource tree given
range and alignment.
*/
static int find_resource(struct resource
*root, struct resource *new,
unsigned long size,
unsigned long min, unsigned long max,
unsigned long align,
void (*alignf)(void *, struct
resource *, unsigned long),
void *alignf_data)
{
struct resource *this = root->child;
new->start =
root->start;
for(;;) {
if (this)
new->end = this->start;
else
new->end = root->end;
if (new->start
new->start =
min;
if (new->end > max)
new->end = max;
new->start =
(new->start + align - 1) & ~(align - 1);
if
(alignf)
alignf(alignf_data, new, size);
if (new->start end && new->end -
new->start + 1 >= size)
{
new->end = new->start + size - 1;
return 0;
}
if (!this)
break;
new->start =
this->end + 1;
this = this->sibling;
}
return -EBUSY;
}
对该函数的NOTE如下:
同样,该函数也要遍历root的child链表,以寻
找未被使用的资源空洞。为此,他让this指针表示当前正被扫描的子资源节点,其初始值等于root->child,即指向child链表中的第一
个节点,并让new->start的初始值等于root->start,然后用一个for循环开始扫描child链表,对于每一个被扫描的节
点,循环体执行如下操作:
①首先,判断this指针是否为NULL。如果不为空,就让new->end等于
this->start,也即让资源new表示当前资源节点this前面那一段未使用的资源区间。
②如果this指针为空,那就让
new->end等于root->end。这有两层意思:第一种情况就是根结点的child指针为NULL(即根节点没有所有子资源)。因此
此时先暂时将new->end放到最大。第二种情况就是已遍历完整个child链表,所以此时就让new表示最后一个子资源后面那一段未使用的资源
区间。
③根据参数min和max修正new->[start,end]的值,以使资源new被包含在[min,max]区域内。
④接下来进行对齐操作。
⑤然后,判断经过上述这些步骤所形成的资源区域new是否是一段有效的资源(end必须大于或等于start),而
且资源区域的长度满足size参数的需求(end-start+1>=size)。如果这两个条件均满足,则说明我们已找到了一段满足条件的资源空
洞。因此在对new->end的值进行修正后,然后就能返回了(返回值0表示成功)。
⑥如果上述两条件不能同时满足,则说明还没有找
到,因此要继续扫描链表。在继续扫描之前,我们还是要判断一下this指针是否为空。如果为空,说明已扫描完整个child链表,因此就能推出for循环
了。否则就将new->start的值修改为this->end+1,并让this指向下一个兄弟资源节点,从而继续扫描链表中的下一个子资
源节点。
3.2.5 分配接口allocate_resource()
在find_resource()函数的基础上,函数
allocate_resource()实现:在一颗资源树中分配一条指定大小的、且包含在指定区域[min,max]中的、未使用资源区域。其原始码如
下:
/*
* Allocate empty slot in the resource tree given range
and alignment.
*/
int allocate_resource(struct resource *root,
struct resource *new,
unsigned long size,
unsigned long min, unsigned long max,
unsigned long align,
void
(*alignf)(void *, struct resource *, unsigned long),
void *alignf_data)
{
int err;
write_lock(&resource_lock);
err
= find_resource(root, new, size, min, max, align, alignf, alignf_data);
if
(err >= 0 && __request_resource(root, new))
err =
-EBUSY;
write_unlock(&resource_lock);
return err;
}
3.2.6 获取资源的名称列表
函数get_resource_list()用于获取根节点root的子资源名字列表。该函数主要用来支持
/proc/文件系统(比如实现proc/ioports文件和/proc/iomem文件)。其原始码如下:
int
get_resource_list(struct resource *root, char *buf, int size)
{
char *fmt;
int retval;
fmt = "
%08lx-%08lx : %s
";
if (root->end
fmt
= " %04lx-%04lx : %s
";
read_lock(&resource_lock);
retval =
do_resource_list(root->child, fmt, 8, buf, buf + size) - buf;
read_unlock(&resource_lock);
return retval;
}
能看
出,该函数主要通过调用内部静态函数do_resource_list()来实现其功能,其原始码如下:
/*
* This
generates reports for /proc/ioports and /proc/iomem
*/
static char
* do_resource_list(struct resource *entry, const char *fmt,
int
offset, char *buf, char *end)
{
if (offset
offset = 0;
while (entry) {
const
char *name = entry->name;
unsigned long from, to;
if ((int) (end-buf)
return
buf;
from = entry->start;
to = entry->end;
if (!name)
name = "";
buf += sprintf(buf, fmt +
offset, from, to, name);
if (entry->child)
buf = do_resource_list(entry->child, fmt, offset-2,
buf, end);
entry = entry->sibling;
}
return buf;
}
函数do_resource_list()主要通过一个while{}循环及递归嵌套调用来实现,
较为简单,这里就不在周详解释了。
阅读(2401) | 评论(0) | 转发(0) |