分类: LINUX
2012-02-02 12:34:35
Table of Contents
1 中断
1.1 中断的类型
依据中断的来源,中断可以分为两类:
1.2 硬件 IRQs (Interrupt Requests)
严格来讲,外设引起的中断应该被称为中断请求。中断请求号和中断号中间有一定的 映射关系。这个映射关系和平台有关。
1.3 中断的处理
中断处理函数根据中断号被存放到一个 Array 中;从这个 Array 中, 可以依据中断号,找到相应的 Handler 。
1.3.1 中断处理的出口和入口
中断程序的处理和把大象放进冰箱类似,可分三步:
其中,第一步和第三步又成为中断函数的入口和出口,他们负责确保处理器在用户空 间和内核空间的切换。 入口路径的一个主要任务就是从用户态堆栈切换到内核态的堆栈,与此同时,他还需要负责保存正在执行的应用程序使用的寄存器状态,以便在中断处理函数推出后恢复。 数据结构 pt_regs 用来列出内核态所修改的寄存器,该数据结构由底层的汇编语言来负责填写。 中断处理的出口,除了负责内核态和用户态的切换,还要检查是否需要调度等等。
1.3.2 中断处理函数
中断的嵌套会带来很多问题,在中断处理函数重屏蔽其他中断源可以解决防止中断嵌套,但是长时间地屏蔽中断会导致内核遗漏掉一些重要的中断。 因此,中断处理函数重中断的屏蔽时间应该越短越好。 中断处理函数应满足下面两个要求:
上述两个条件中,后者可以通过优化中断处理函数的设计和编码来实现,但想实现前者,则不那么容易。 但实际上,并非中断处理程序的所有工作的重要性都是相同的,通常来讲,一个中断服务程序可根据其是否需要马上处理而分为三个部分:
对中断处理函数的划分,并根据各个部分的不同的重要性,可以将中断函数拆成若干不同的片段,放在不同的上下文中执行, 很大程度上,在保证了系统事件完整性的前提下,防止了中断的嵌套。
1.4 数据结构
1.4.1 基本数据结构和中断处理子系统
1.4.2 IRQ 控制器抽象 —— irq_chip
irq_chip 是一个对于 IRQ 控制器的抽象,其定义和说明如下: /*** struct irq_chip - hardware interrupt chip descriptor * * @name: name for /proc/interrupts * @startup: start up the interrupt (defaults to ->enable if NULL) * @shutdown: shut down the interrupt (defaults to ->disable if NULL) * @enable: enable the interrupt (defaults to chip->unmask if NULL) * @disable: disable the interrupt * @ack: start of a new interrupt * @mask: mask an interrupt source * @mask_ack: ack and mask an interrupt source * @unmask: unmask an interrupt source * @eoi: end of interrupt - chip level * @end: end of interrupt - flow level * @set_affinity: set the CPU affinity on SMP machines * @retrigger: resend an IRQ to the CPU * @set_type: set the flow type (IRQ_TYPE_LEVEL/etc.) of an IRQ * @set_wake: enable/disable power-management wake-on of an IRQ * * @bus_lock: function to lock access to slow bus (i2c) chips * @bus_sync_unlock: function to sync and unlock slow bus (i2c) chips * * @release: release function solely used by UML * @typename: obsoleted by name, kept as migration helper */ struct irq_chip { const char *name; unsigned int (*startup)(unsigned int irq); void (*shutdown)(unsigned int irq); void (*enable)(unsigned int irq); void (*disable)(unsigned int irq); void (*ack)(unsigned int irq); void (*mask)(unsigned int irq); void (*mask_ack)(unsigned int irq); void (*unmask)(unsigned int irq); void (*eoi)(unsigned int irq); void (*end)(unsigned int irq); int (*set_affinity)(unsigned int irq, const struct cpumask *dest); int (*retrigger)(unsigned int irq); int (*set_type)(unsigned int irq, unsigned int flow_type); int (*set_wake)(unsigned int irq, unsigned int on); void (*bus_lock)(unsigned int irq); void (*bus_sync_unlock)(unsigned int irq); /* Currently used only by UML, might disappear one day.*/ #ifdef CONFIG_IRQ_RELEASE_METHOD void (*release)(unsigned int irq, void *dev_id); #endif /* * For compatibility, ->typename is copied into ->name. * Will disappear. */ const char *typename; };
1.4.3 中断处理函数的 Representation —— irqaction
irqaction 的定义如下: /*** struct irqaction - per interrupt action descriptor * @handler: interrupt handler function * @flags: flags (see IRQF_* above) * @name: name of the device * @dev_id: cookie to identify the device * @next: pointer to the next irqaction for shared interrupts * @irq: interrupt number * @dir: pointer to the proc/irq/NN/name entry * @thread_fn: interupt handler function for threaded interrupts * @thread: thread pointer for threaded interrupts * @thread_flags: flags related to @thread */ struct irqaction { irq_handler_t handler; unsigned long flags; const char *name; void *dev_id; struct irqaction *next; int irq; struct proc_dir_entry *dir; irq_handler_t thread_fn; struct task_struct *thread; unsigned long thread_flags; }; 其中:
|
前面提到了 IRQ 子系统的三个 抽象层: High-level interrupt Service routine, Interrupt Flow Handling, Chip-level hardware Encapsulation. 本节描述 Interrupt Flow Handling 的过程, 即, 处理边沿触发、水平触发等等的过程。
内核提供了一些标准函数用于注册 irq_chips 和设置 flow handlers ,如下:
int set_irq_chip(unsigned int irq, struct irq_chip *chip);前面提到,中断有不同的触发方式: edge-trggering 或者 level-triggering, 内核对他们的处理方式有所不同。 但相同的是,这两个处理中,都需要在 flow-handling 完成后负责调用 high-level 的中断处理函数。
边沿触发方式在现代的硬件中是最常见的一种方式,该方式的默认处理函数为 handle_edge_irq .
边沿触发中断,在处理时候一般无需禁用该中断源。这样,在多处理器系统上,可能会出现这种情况: 一个处理器上正在处理这个Flow-Handnle,此时在这个处理过程尚未完成的时候,又产生了另外一个边沿触发的中断。 对于这种情况, handler_edge_irq 的处理方法是:先更新这个 irq 的 irq_desc 上的状态为 PENDING, 然后暂时将这个中断 mask 掉(这里的 mask 是通过 irq_chip 结构提供的函数在硬件上操作,而不是内核中软件意义上的 mask); 而前面负责处理这个 irq 的 CPU , 在处理完了一个 IRQ 后,检查这个 irq_desc 的状态,如果为 PENDING, 则表示在前面的处理过程中又有新的中断信号产生了,需要继续处理,直到这个 irq_desc 的状态不是 PENDING 为止。
在 Flow-Handle 的每个循环的结尾, hander_edge_irq 都会以 iqd_desc->action 为参数来通过 handleIRQevent 调用 High-level 处理函数 。
整体流程如下图所示:
handle_edge_irq 流程
Level-Triggered Interrups 由函数 handle_level_irq 负责处理,他的流程比 handle_edge_irq 要简单一些, 如下图所示:
handle_level_irq 流程
需要注意的是, Level-Triggered Interrups 在处理的时候必须要将其 Mask 掉,这个 Mask 的过程通过函数 mask_ack_irq 来完成。 maks_ack_irq 不但将 irq_desc 的状态设置为 mask ,同时还调用了 chip->mask_ack 来设置硬件的 mask , 并向硬件发送 ACK 。 对于多核 CPU 所潜在的竞争冒险1,可以通过检测 irq_desc 的状态来避免 —— 一旦检测到 irq_desc->status 中包含了 IRQ_INPROGRESS , 则表明该 irq 正在被处理,直接退出即可。
同边沿触发的处理一样,这里也通过 handle_IRQ_event 来调用了 High-level 的处理函数。
除了上述两种类型的的中断之外,还有一些其他不常用的中断,内核为他们提供了默认的 handler 。
很多现代的 IRQ 硬件仅需要做一点点流处理工作 (Flow-Handle),对他们来讲,在 IRQ 处理完毕之后, 只需要调用一个 Chip-specific 的函数: chip->eoi 就可以了, 函数 handle_fasteoi_irq 负责这个工作。
一些实在是很简单的中断根本就不需要流控制,内核为他们提供了 handle_simple_irq 。
有些 IRQ 只能发上在 SMP 上的某个指定的 CPU 上,这种 IRQ 被成为 Per-CPU IRQ , 内核提供了 handle_percpu_irq 来处理他们。该函数负责在中断处理完成之后向硬件汇报中断的接收,并调用 EOI 。
函数 request_irq 用于注册 IRQ , 其定义为:
static inline int __must_check可见,该函数是 request_threaded_irq 的一个 wrapper ,并将 request_threaded_irq 的参数 thread_fn 设置为空。 request_threaded_irq 的流程图如下图所示:
request_threaded_irq
该函数首先从内核中获取了这个 irq 对应的 irq_desc, 然后创建 irqaction, 设置这个 action 的 handler, flags, name, 和 dev_id 。 随后,将其余的工作交给了函数 __setup_irq, 由 __setup_irq 完后后续的工作。
__setup_irq 的主要作用如下:
前面提到过,内核通过一系列的事件的相关信息来生成随机数 (/dev/random),这里,如果传入的 flags 中声明了 IRQF_SAMPLE_RANDOM ,则调用 rand_initialize_irq 将 IRQ 添加到熵池所需的相关数据结构中。
前面提到,内核有一个全局的 irq_desc Array, 从这个 Array 中可以根据 IRQ Number 来找到相应的 irq_desc ; 此外,每个 irq_desc 中有一个 irqaction list ,这个 list 中记录了该 irq 中断发生时候需要调用的每一个 irqaction 。 __setup_irq 需要将传入的 irqaction 添加到这个 list 的队尾。
根据传入参数的flags, 做一些别的检查和设置,没具体细看。
__setup_irq 的最后,调用 register_irq_proc ,在 proc/irq 中为相应的 IRQ 创建了节点。 然后又调用 register_handler_proc , 生成/proc/irq/NUM/NAME 。从而使用户可以从 procfs 中得到该 IRQ 的信息。
在释放 IRQ 的时候,仅提供一个 IRQ Number 不行的,还必须提供这个 IRQ 对应的 dev_id. 该过程由函数 free_irq 来完成, free_irq 是 __free_irq 的一个包装,调 用 __free_irq 来完成 irqaction 的注销。
__free_irq 根据传入的 dev_id 从这个 IRQ 的所有 irqaction 上找到设备对应的那个 irqaction , 并将其从 IRQ 的 irqaction List 中移走; 如果移走的这个 handler 是这个 IRQ Line 上唯一的一个, 那么还需要将这个 IRQ Line Diable。 随后,清理 proc 文件系统中的结点, 并将 action 这个结构返回给 free_irq, 由 free_irq 负责将数据结构 free 。
前面提到的 irq_request 仅用于外设的 IRQ 申请, 而对于 CPU 本身已经软件上的中断,处理的流程与此不同。 诸如软件发出的中断、异常以及陷阱,这些东西的注册是在系统初始化的时候执行的,并且初始化完成之后,在整个系统的活动周期内不会发生改变。 由于系统的中断是不能共享的(也没有必要共享,资源多得很),内核所需要做的,仅仅是将中断号和处理函数相关联。
一般来讲,内核对于这种系统中断的响应有如下两种:
例如,在 IA-32 和 AMD64 系统,当一个数字被0除的时候,会产生中断 0 , 这个中断会调用处理函数 divide_error ,并向用户进程发送信号 —— SIGPFE 。
例如 IA-32 系统下, 中断 14 被用来作为 page fault (内存却页或者页面错误)的信号,当这个错误发生的时候,内核可以自动对该错误进行纠正。
1 竞争冒险和前面提到的边沿触发中断的嵌套不同,由于处理 Level-Triggered Interrups 时候, 中断源那个硬件已经被暂时 Mask 掉,因此在一个水平触发中断的处理期间,同一个设备不会产生另外一个水平触发中断。 因此,竞争冒险指的是多个 CPU 同时选定要处理同一个 irq 。