kswapd和pdflush-binary_XY.Z-ChinaUnix博客

binary_XY.Z的ChinaUnix博客binary.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

binary_XY.Z

博客访问： 1514400
博文数量： 263
博客积分： 10851
博客等级：上将
技术积分： 2627
用户组：普通用户
注册时间： 2008-11-26 22:40

文章分类

全部博文（263）

终端开发（3）

android（2）
问题集（1）
linux桌面应用（2）
linux内核（13）

内核开发（1）

内核管理（12）
龙套箱（1）
虚拟技术（9）

xen（1）

vmware（8）
linux网络安全（22）

网络其他（2）

netfilter/iptabl（4）

网络基础（16）
数据库（20）

oracle（0）

mysql（20）
团队建设（2）
linux大杂烩（10）
linux系统管理（95）

lvs + heartbeat（11）

rpm（5）

包管理工具（0）

工具集（2）

vsftpd（2）

nginx（8）

rsync（5）

cacti（0）

resin（0）

apache（2）

nagios（0）
linux编程开发（27）

java web开发（1）

java（2）

系统编程（8）

php（3）

c/c++（11）
linux脚本（57）

tcl与expect（2）

perl（0）

bash（54）
未分配的博文（1）

文章存档

2013年（4）

2012年（25）

2011年（33）

2010年（50）

2009年（138）

2008年（13）

我的朋友

相关博文

kswapd和pdflush

分类： LINUX

2011-04-06 11:52:13

首先，它们存在的目的不同:
kswapd的作用是管理内存;
pdflush的作用是同步内存和磁盘，当然因为数据写入磁盘前可能会换存在内存，这些缓存真正写入磁盘由三个原因趋势：1.用户要求缓存马上写入磁盘；2.缓存过多，超过一定阀值，需要写入磁盘；3.内存吃紧，需要将缓存写入磁盘以腾出地方。上述原因使得kswapd和pdflush有交叉的地方，因此很多人混淆了它们。

    它们相同的地方都是定期被唤醒，都是以守护进程（内核进程）的形式存在:
    kswapd试图保证内存永远都是可满足用户要求的，为了实现这种承诺，它必须采取一定的策略;
    pdflush试图保证内存和磁盘的数据是同步的，不会因为缓存的原因使内存和磁盘的数据不同步从而造成数据丢失或者损坏，为了实现这种承诺，它同样也要采取一定的策略。

那么它们之间的交叉点在何处呢？比如，在用户要求内存不能被满足或者空闲内存的数量已经低于某一个值的时候，kswapd被唤醒，它必须为用户的要求提供服务，因此试图换出一部分正在使用的内存使之成为空闲内存以供用户使用，这时，磁盘缓存也是正在被使用的内存，因此，kswapd需要将它们换出，这里的换出和匿名页面被换到交换分区是一样的概念，将磁盘缓存换到哪里呢？当然哪里来哪里去了。linux不区分匿名页面对应的交换分区和真实文件的磁盘缓存对应的磁盘文件分区，实际上在将匿名页面写到交换分区的时候也是按照写文件的形式进行的，读源代码的时候就会发现有一个address_space_operations结构体，里面的readpage和writepage就是读写页面的回调函数，linux的这个实现方式表明，写匿名页面和写ext2的缓存页面没有本质的区别，仅仅换一下那几个address_space_operations里面的回调函数就行。因此kswapd也会将磁盘缓存回写到磁盘，和pdflush所作的工作一样，这就是它们交叉的地方，当然如果kswapd已经将页面写入了磁盘，就会清除掉页面的脏标志，这样，在pdflush扫描脏页的时候就不会二次回写了。

    既然kswapd和pdflush有联系，那么联系它们的纽带是什么？当然是内核中的lru链表了，本来需要pdflush写入磁盘的页面也许要通过kswapd写入，如何让kswapd看到pdflush负责的页面呢？实际上linux并没有刻意关注这个事情，内核那么复杂，如果这么细致的考虑问题谁都会发疯的。因此linux采用了更加宏伟的方式，就是将事情抽象，不再操心什么回写啊，内存释放之类的细节，而是抽象出了内存管理和缓存管理这些个模块，然后模块和模块之间建立一个耦合点，也可以理解成一个接口，这个东西就是lru链表，linux规定，凡是想纳入内存管理范畴的内存物理页面都要加入lru链表，而kswapd就是内存管理的执行者，它操作的正是这个链表，这样它就不需要别的什么了，只需要告诉大家，你想让我管理，别让我去找你，你自己加入lru链表吧，就这样而已。缓存管理模块当然想加入内存管理，因此所有的磁盘缓存页面都在加入缓存的同时加入了lru链表，这样缓存管理的执行者pdflush和内存管理的执行者kswapd就不需要直接交互商量事情了，一个lru链表解除了它们的耦合。

    linux中到处都体现了这样的思想，它看似宏大的内核，实际上是高度模块化的，你不要觉得内核中有些东西好像杂糅在一起而被搞的焦头烂额，实际上仔细看看代码就会发现它们之间的耦合点也就是一些很简单的结构，比如我前面文章提到的list_head或者kobject等等。不信的话再看看上面的kswapd和pdflush，如果你想让内存加入缓存管理，那么就设置它为脏（设置一个标志），并加入一棵radix树（本质上radix树和链表没有区别，都是一个连接数据结构，早期的内核版本中的缓存就是链表结构连接起来的）；如果你想让内存页面加入内存管理，那么就加入lru链表，如果你想两个都加入呢？很简单，设为脏，加入radix树，再加入lru链表，之后就不用管了，kswap和pdflush会各司其职的，前者查lru，后者查radix 和标志位，它们之间唯一需要交互的就是，一方做完工作后要让另一方看到，这实际上不是它们之间的交互，而仅仅是一项工作的收尾工作，或者说是汇报工作，你做完一件事总得有点效果吧。

阅读(1283) | 评论(0) | 转发(0) |

上一篇：The Linux Page Cache and pdflush

下一篇：FC6中卸载util-linux，升级为util-linux-ng

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6