将晦涩难懂的技术讲的通俗易懂
分类: LINUX
2016-05-07 21:49:24
Linux系统中的知名内核线程(1)——ksoftirqd和events
我们知道linux系统中有很多系统创建的内核线程(kthread),这些内核线程是系统正常工作的保证。这里我们看下其中比较知名的两个:ksoftirqd和events。
提到ksoftirqd就不得不说下“软中断(softirq)”,因为这个线程正是用来执行软中断的(准确的说应该是执行过多的软中断)。我们知道按照优先级来说,中断>软中断>用户进行,也就是说中断可以打断软中断,而软中断又可以打断用户进程。
而对于软中断,内核会在几个特殊的时机执行(注意执行和调度的区别,调度软中断只是对软中断打上待执行的标记,并没有真正执行),而在中断处理程序返回时处理是最常见的。软中断的触发频率有时可能会很高(例如进行大流量网络通信期间)。更不利的是,软中断的执行函数有时还会调度自身,所以如果软中断本身出现的频率较高,再加上他们又有将自己重新设置为可执行状态的能力,那么就会导致用户空间的进程无法获得足够的处理时间,因而处于饥饿状态。为了避免用户进程的饥饿。内核开发者做了一些折中,最终在内核的实现方案中是不会立即处理由软中断自身重新触发的软中断(不允许软中断嵌套)。而作为改进,内核会唤醒一组内核线程来处理这些过多的软中断,这些内核线程在最低优先级上运行(nice值是19),这能避免它们跟其他重要的任务抢夺资源,但它们最终肯定会被执行,所以这个方案能够保证软中断负载很重的时候,用户进程不会因为得不到处理时间而处于饥饿状态,相应的,也能保证过量的软中断终究会得到处理。
每个处理器都有一个这样的线程。所有的线程的名字都叫做ksoftirq/n,区别在于n,他对应的是处理器的编号。
下面我们详细的看下软中断是如何被ksoftirqd执行的。首先看下软中断的处理调度过程。一个软中断在执行之前必须被调度(激活),术语称为"raise the softirq"。被激活的softirq通常并不会立即执行,一般会在之后的某个时刻检查当前系统中是否有被pending的softirq,如果有就去执行,linux执行软中断的函数是do_softirq(),而这个函数会再两个地方被调用,一个是中断返回时,另一个就是我们讨论的ksoftirqd内核线程。我们先来看中断返回的情况。
// do_IRQ 函数执行完硬件 ISR 后退出时调用此函数。
点击(此处)折叠或打开
这里需要重点分析一下in_interrupt()函数的含义。在linux内核中,为了方便判断当前执行路径在哪个上下文环境中,定义了几个接口:
点击(此处)折叠或打开
从注释可以看出包括:硬件中断上下文,软件中断上下文,不可屏蔽上下文等。在这些宏中,都涉及到了preempt_count()这个宏,这个宏是一个比较重要的宏,在Linux源码中对其做了详细的注释:
点击(此处)折叠或打开
从注释可以看出,preempt_count各个bit位的含义:
(1)bit0~7位表示抢占计数,即支持最大的抢占深度为256
(2)bit8~15位表示软中断计数,即支持最大的软中断的个数为256,需要注意的是,由于软中断还受制于pending状态,一个32位的变量,因此实际最大只能支持32个软中断。
(3)bit16~25位表示硬件中断嵌套层数,即最大可支持的嵌套层次为1024,实际情况下这是不可能的,因为中断的嵌套层数还受制于中断处理的栈空间的大小。
介绍了这么多,现在了重点分析下上面提到的in_interrupt到底表示什么意思?
点击(此处)折叠或打开
从其宏定义可以看出,in_interrupt宏的值是硬件中断嵌套层数,软中断计数以及可屏蔽中断三者之和。所以如果in_interrupt()的值大于0,就不会处理软中断,意思是(a)当有硬件中断嵌套,(b)或软中断被禁止 (c)不可屏蔽中断的情况下,不会去处理软中断。有人会问软中断不是从中断处理后irq_exit中进入的吗?那软中断执行时preempt_count的硬中断位不是还没有修改掉吗?其实已经做了修改,就在irq_exit函数中的sub_preempt_count中进行。其实执行过sub_preempt_count就算退出中断处理程序了。
l 注:软中断被禁止会增加软中断的计数;
点击(此处)折叠或打开
下面重点分析以下do_softirq(),了解Linux内核到底是怎么来处理softirq的。
点击(此处)折叠或打开
注意调用local_softirq_pending()获取pending和将pending请0这两个操作一定要位于关中断情况,否则两个操作间可能发生中断,中断再次调度软中段的置位标记会丢失。
真正的软中断处理再__do_softirq中。
点击(此处)折叠或打开
这个函数就是ksoftirqd内核线程对应的执行函数。只要有待处理的软中断(由softirq_pending()函数负责发现),ksoftirq就会调用do_softirq()去处理它们。通过重复执行这样的操作,重新触发的软中断也会被执行。如果有必要的话,每次迭代后都会调用schedule()以便让更重要的进程得到处理机会。当所有需要执行的操作都完成以后,该内核线程将自己设置为TASK_INTERTUPTIBLE状态,唤起调度程序选择其他可执行的进程投入运行。
点击(此处)折叠或打开
最后说明一下,因为tasklet也是通过软中断实现的,所以tasklet过多也会导致ksoftirqd线程的调度,进而再进程上下文中执行tasklet。(ksoftirqd执行软中断处理程序,tasklet对应的软中断处理程序执行所有调度的tasklet)
下面看events线程,提到这个线程就不得不说道“工作队列(workqueue)”了,这个线程是就是工作队了用来执行队列中的工作的。
Workqueue也是linux下半部(包括软中断、tasklet、工作队列)实现的一种方式。Linux中的Workqueue机制就是为了简化内核线程的创建。通过调用workqueue的接口就能创建内核线程。并且可以根据当前系统CPU的个数创建线程的数量,使得线程处理的事务能够并行化。
Workqueue是内核中实现简单而有效的机制,他显然简化了内核daemon的创建,方便了用户的编程。
Workqueue机制中定义了两个重要的数据结构,分析如下:
1.cpu_workqueue_struct结构。该结构将CPU和内核线程进行了绑定。在创建workqueue的过程中,Linux根据当前系统CPU的个数创建cpu_workqueue_struct。在该结构主要维护了一个任务(work_struct)队列,以及内核线程需要睡眠的等待队列,另外还维护了一个任务上下文,即task_struct。
2. work_struct结构是对任务的抽象。在该结构中需要维护具体的任务方法,需要处理的数据,以及任务处理的时间。该结构定义如下:
点击(此处)折叠或打开
当用户调用workqueue的初始化接口create_workqueue或者create_singlethread_workqueue对workqueue队列进行初始化时,内核就开始为用户分配一个workqueue对象,并且将其链到一个全局的workqueue队列中。然后Linux根据当前CPU的情况,为workqueue对象分配与CPU个数相同的cpu_workqueue_struct对象,每个cpu_workqueue_struct对象都会存在一条任务队列。紧接着,Linux为每个cpu_workqueue_struct对象分配一个内核thread,即内核daemon去处理每个队列中的任务。至此,用户调用初始化接口将workqueue初始化完毕,返回workqueue的指针。
在初始化workqueue过程中,内核需要初始化内核线程,注册的内核线程工作比较简单,就是不断的扫描对应cpu_workqueue_struct中的任务队列,从中获取一个有效任务,然后执行该任务。所以如果任务队列为空,那么内核daemon就在cpu_workqueue_struct中的等待队列上睡眠,直到有人唤醒daemon去处理任务队列。
Workqueue初始化完毕之后,将任务运行的上下文环境构建起来了,但是具体还没有可执行的任务,所以,需要定义具体的work_struct对象。然后将work_struct加入到任务队列中,Linux会唤醒daemon去处理任务。
上述描述的workqueue内核实现原理可以描述如下:
在Workqueue机制中,提供了一个系统默认的workqueue队列——keventd_wq,这个队列是Linux系统在初始化的时候就创建的。用户可以直接初始化一个work_struct对象,然后在该队列中进行调度,使用更加方便。
我们看到的events/0,events/1这些内核线程就是这个默认工作队列再每个cpu上创建的执行任务(work)的kthread。
有人会问,那我们如果自己创建工作队列呢?如果通过create_singlethread_workqueue来创建,那么只会产生一个kthread,如果使用create_workqueue创建,则和默认工作队列一样,在每个cpu上创建一个kthread,kthread的名字有参数传入。
l Workqueue编程接口
序号 |
接口函数 |
说明 |
1 |
create_workqueue |
用于创建一个workqueue队列,为系统中的每个CPU都创建一个内核线程。输入参数: @name:workqueue的名称 |
2 |
create_singlethread_workqueue |
用于创建workqueue,只创建一个内核线程。输入参数: @name:workqueue名称 |
3 |
destroy_workqueue |
释放workqueue队列。输入参数: @ workqueue_struct:需要释放的workqueue队列指针 |
4 |
schedule_work |
调度执行一个具体的任务,执行的任务将会被挂入Linux系统提供的workqueue——keventd_wq输入参数: @ work_struct:具体任务对象指针 |
5 |
schedule_delayed_work |
延迟一定时间去执行一个具体的任务,功能与schedule_work类似,多了一个延迟时间,输入参数: @work_struct:具体任务对象指针 @delay:延迟时间 |
6 |
queue_work |
调度执行一个指定workqueue中的任务。输入参数: @ workqueue_struct:指定的workqueue指针 @work_struct:具体任务对象指针 |
7 |
queue_delayed_work |
延迟调度执行一个指定workqueue中的任务,功能与queue_work类似,输入参数多了一个delay。 |