CFS调度的总结 - （单rq vs 多rq）-liujunwei1234-ChinaUnix博客

少帅的天空linuxsky.blog.chinaunix.net

博客访问： 3398204
博文数量： 258
博客积分： 9440
博客等级：少将
技术积分： 6998
用户组：普通用户
注册时间： 2009-05-03 10:28

个人简介

-- linux爱好者，业余时间热衷于分析linux内核源码 -- 目前主要研究云计算和虚拟化相关的技术，主要包括libvirt/qemu，openstack，opennebula架构和源码分析。 -- 第五届云计算大会演讲嘉宾微博：@Marshal-Liu

文章分类

全部博文（258）

OpenStack（20）
OpenNebula（11）
系统问题（19）
虚拟化/云计算（26）
用户态驱动（3）
latex（10）
嵌入式（13）
环境搭建（linux（20）
体系结构（12）
IT 新闻（9）
linux环境编程（29）
qt程序设计（9）
c/c++ 学习（11）
linux 源码分析（61）
未分配的博文（5）

文章存档

2016年（1）

2015年（4）

2014年（16）

2013年（22）

2012年（41）

2011年（59）

2010年（40）

2009年（75）

我的朋友

相关博文

CFS调度的总结 - （单rq vs 多rq）

分类： LINUX

2012-02-27 10:33:59

近来和一个师兄谈到了CFS调度算法，我以前一直以为CFS的任务就绪队列是全局的，即有全局唯一的rq，但是师兄说是Per-CPU的，于是回来又仔细分析了下代码，发现果然是Per-CPU的。由这个简单的问题先来说说我为啥认为rq是全局唯一的，然后总结下CFS调度算法的一些关键点。

一、Per-CPU的rq和全局唯一的rq

在Linux-2.6内核时代，为了更好的支持多核，Linux调度器普遍采用了per-cpu的run queue，从而克服了多CPU系统中，全局唯一的run queue由于资源的竞争而成为了系统瓶颈的问题，因为在同一时刻，一个CPU访问run queue时，其他的CPU即使空闲也必须等待，大大降低了整体的CPU利用率和系统性能。当使用per-CPU的run queue之后，每个CPU不再使用大内核锁，从而大大提高了并行处理的调度能力。

有利必有弊，必须辩证的来分析自然界的现象。我开始认为全局的rq比per-cpu的优势在来源于分布式系统中的”排队论“，即典型的银行排队系统，在有一个取票口，多个服务口的情况下，系统才能具有最大的吞吐率（具体参见排队论的相关文章），同时，per-CPU还会产生一些可调度性的NP问题。除了这些理论的问题，查阅了相关的资料后，per-CPU的run queue还存在以下实际的问题：

采用per-cpu的run queue所带来的好处会被追求公平性的load balance代码所抵消。在目前的CFS调度器中，每颗CPU只维护本地run queue中所有进程的公平性，为了实现跨CPU的调度公平性，CFS必须定时进行 load balance，将一些进程从繁忙的CPU的run queue中移到其他空闲的run queue中。这个load balance的过程需要获得其他run queue的锁，这种操作降低了多运行队列带来的并行性，并且在复杂情况下，这种因 load balance而引入的footprint 将非常可观。
当然，load balance引入的加锁操作依然比全局锁的代价要低，这种代价差异随着CPU个数的增加而更加显著。但请您注意，假若系统中的CPU个数有限时，多run queue的优势便不明显了。而采用单一队列之后，每一个需要调度的新进程都可以在全局范围内查找最合适的CPU，而无需CFS那样等待load balance代码来决定，这减少了多CPU之间裁决的延迟，最终的结果是更小的调度延迟。

其次，为了维护多CPU上的公平性，CFS采用了负载平衡机制，这些复杂代码抵消了per cpu queue曾带来的好处。

下面的数据是新墨西哥大学的 Taylor Groves, Je Knockel, Eric Schulte对采用per-CPU的run queue和全局唯一的run queue做的一个响应时间的试验。

从上图可以看出采用全局唯一单队列的BFS调度算法的响应时间明显优于采用多per-CPU队列的CFS调度算法,说明CFS更适于交互式系统，即桌面系统。（当然，并不是说BFS就优于CFS，毕竟不同的应用场景各有优势，但是CFS考虑的确实太多了，想支持各种情况- CFS 的目标是支持从桌面到高端服务器的所有应用场景，这种大而全的设计思路导致其必须做一些实现上的折中）。

二、CFS关键点总结

1. 虚拟运行时间(vruntime)变化公式

vruntime += delta * (1024/se.load.weight);
/*delta：进程实际增加的运行时间，即从调度实体被选择获得cpu到调度实体放弃CPU这段时间*/

结论：在实际运行时间相同的情况下，调度实体权重越大，vruntime增加的越慢。

2. 进程的理想运行时间计算公式

ideal_time = slice *(se.load.weight/cfs_rq.load.weight);
/*slice为CFS运行队列中所有进程运行一遍所需要的时间*/
/*slice的经验计算公式如下：*/
if(cfs_rq->nr_running > 5)
　　slice = 4 * cfs_rq->nr_running;
else
slice = 20; /*单位ms*/

3. CFS调度时机

在有了上面几个计算公式之后，就可以总结出CFS调度算法的几个调度时机：

(1) 调度实体的状态转换的时刻：进程终止、进程睡眠等，广义上还包括进程的创建(fork)；
(2) 当前调度实体的时机运行时间大于理想运行时间（delta_exec > ideal_runtime）,这一步在时钟中断处理函数中完成；
(3) 调度实体主动放弃CPU，直接调度schedule函数，放弃CPU
(4) 调度实体从中断、异常及系统调用返回到用户态时，回去检查是否需要调度；

阅读(5170) | 评论(3) | 转发(5) |

上一篇：vim + latex-suite 使用技巧

下一篇：linux内核阅读总结

给主人留下些什么吧！~~

GFree_Wind2012-02-27 18:17:35

liujunwei1234: 中科大的，不过刚毕业了！

单rq和多rq各有利弊，肯定都在不断发展，是个博弈的过程，我想Ingo Molnar 肯定也考虑过这个问题，我就是因为前段时间看了一篇多核实.....

不错！

中科大的计算机专业果然不错！

回复 | 举报

liujunwei12342012-02-27 15:08:17

GFree_Wind: 个人还是比较欣赏per CPU的作法。虽然现在由于需要对CPU进行负载均衡，这个锁比全局锁代价好很多了——文中已经提过。

而采用单一队列之后，每一个需要调度的新.....

中科大的，不过刚毕业了！

单rq和多rq各有利弊，肯定都在不断发展，是个博弈的过程，我想Ingo Molnar 肯定也考虑过这个问题，我就是因为前段时间看了一篇多核实时可调度性的论文（重点可调度性分析），所以有了个全局队列的印象。不过，load balance确实发展很快，也是个热点！

回复 | 举报

GFree_Wind2012-02-27 12:07:56

个人还是比较欣赏per CPU的作法。虽然现在由于需要对CPU进行负载均衡，这个锁比全局锁代价好很多了——文中已经提过。

而采用单一队列之后，每一个需要调度的新进程都可以在全局范围内查找最合适的CPU，而无需CFS那样等待load balance代码来决定——我觉得对于新进程决定在哪个CPU上运行时，可以简单的处理，不需要引入复杂的代码。然后由定时的load balance去平衡CPU间的负载——只是一点浅见。

随着对load balance算法的提高，per CPU的性能还是应该优于使用全局锁的。

问个私人问题，你目前在哪个学校啊？

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6