一、前言
在linux2.6.32之前,linux下数据同步是基于pdflush线程机制来实现的,在linux2.6.32以上的版本,内核彻底删掉了pdflush机制,改为了基于per-bdi线程来实现数据同步,与pdflush线程相比,在per-bdi线程机制中,每个后备存储器拥有自己唯一的回写线程,数据同步时需要更少的线程、也不会有多个pdflush对同一个后备存储器进行回写的竞态问题,回写的效率更高。
二、初始化默认的后备存储器default_backing_dev_info
-
static int __init default_bdi_init(void)
-
{
-
int err;
-
-
/*创建同步每个后备存储器的超级块的线程*/
-
sync_supers_tsk = kthread_run(bdi_sync_supers, NULL, "sync_supers");
-
BUG_ON(IS_ERR(sync_supers_tsk));
-
-
/*初始化一个定时器,该定时器控制同步超级块的周期,每隔dirty_writeback_interval去唤醒一次sync_supers_tsk,从而同步超级块。
-
dirty_writeback_interval可以通过修改/proc/sys/vm/下的dirty_writeback_centisecs来修改,默认值是500,单位是10ms
-
定时器函数sync_supers_timer_fn用于唤醒同步超级块的线程sync_supers_tsk,并且更新定时器的到期时间,具体实现如下*/
-
setup_timer(&sync_supers_timer, sync_supers_timer_fn, 0);
-
/*用于更新定时器的到期时间,详见下面代码。*/
-
bdi_arm_supers_timer();
-
-
/*初始化default_backing_dev_info的成员变量,初始化相关的链表,相关的变量赋初值等操作,请读者自行阅读。*/
-
err = bdi_init(&default_backing_dev_info);
-
if (!err)
-
/*调用bdi_register注册默认的后备存储器default_backing_dev_info到bdi_list链表,并创建默认的backing_dev_info管理线程,
-
用于管理其他的后备存储器的数据同步线程的创建和销毁,所有的后备存储器在初始化时都会调用bdi_register注册到bdi_list链表中。
-
bdi_register详见下文分析。*/
-
bdi_register(&default_backing_dev_info, NULL, "default");
-
-
/*初始化空的后备存储器,可以忽略。*/
-
err = bdi_init(&noop_backing_dev_info);
-
-
return err;
-
}
sync_supers_timer_fn函数唤醒超级块数据同步线程,然后重设定时器。
-
static void sync_supers_timer_fn(unsigned long unused)
-
{
-
wake_up_process(sync_supers_tsk);
-
bdi_arm_supers_timer();
-
}
bdi_arm_supers_timer函数重设定时器
-
void bdi_arm_supers_timer(void)
-
{
-
unsigned long next;
-
-
if (!dirty_writeback_interval)
-
return;
-
-
next = msecs_to_jiffies(dirty_writeback_interval * 10) + jiffies;
-
mod_timer(&sync_supers_timer, round_jiffies_up(next));
-
}
三、bdi_register()函数分析
bdi_register函数用于注册后备存储器到全局链表bdi_list上,并且判断如果是默认的后备存储器default_backing_dev_info则创建bdi-default线程,用于管理创建或销毁所有后备存储器相关的同步回写线程。
-
int bdi_register(struct backing_dev_info *bdi, struct device *parent,
-
const char *fmt, ...)
-
{
-
va_list args;
-
struct device *dev;
-
-
if (bdi->dev) /* The driver needs to use separate queues per device */
-
return 0;
-
-
va_start(args, fmt);
-
dev = device_create_vargs(bdi_class, parent, MKDEV(0, 0), bdi, fmt, args);
-
va_end(args);
-
if (IS_ERR(dev))
-
return PTR_ERR(dev);
-
-
bdi->dev = dev;
-
-
/*
-
* Just start the forker thread for our default backing_dev_info,
-
* and add other bdi's to the list. They will get a thread created
-
* on-demand when they need it.
-
*/
-
if (bdi_cap_flush_forker(bdi)) {
-
struct bdi_writeback *wb = &bdi->wb;
-
-
wb->task = kthread_run(bdi_forker_thread, wb, "bdi-%s",
-
dev_name(dev));
-
if (IS_ERR(wb->task))
-
return PTR_ERR(wb->task);
-
}
-
-
bdi_debug_register(bdi, dev_name(dev));
-
set_bit(BDI_registered, &bdi->state);
-
-
spin_lock_bh(&bdi_lock);
-
list_add_tail_rcu(&bdi->bdi_list, &bdi_list);
-
spin_unlock_bh(&bdi_lock);
-
-
trace_writeback_bdi_register(bdi);
-
return 0;
-
}
阅读(1204) | 评论(0) | 转发(0) |