Chinaunix首页 | 论坛 | 博客
  • 博客访问: 3795325
  • 博文数量: 93
  • 博客积分: 3189
  • 博客等级: 中校
  • 技术积分: 4231
  • 用 户 组: 普通用户
  • 注册时间: 2009-02-02 13:29
个人简介

出没于杭州和青岛的程序猿一枚,对内核略懂一二

文章分类

全部博文(93)

文章存档

2016年(2)

2015年(3)

2014年(11)

2013年(29)

2012年(16)

2011年(5)

2010年(5)

2009年(22)

分类: LINUX

2013-08-29 13:20:48

欢迎转载,转载请注明出处:http://forever.blog.chinaunix.net!

Mmap Internals

Author: Tony

 

1.    Why write memory which is mmaped from file can be blocked?

最近在调试一个应用层程序的时候发现,尝试修改一个内存变量居然可能会耗时几百ms。这个变量对应的内存是mmap的一个文件,并且这个文件确定已经在pagecache中。

 

我和我的小伙伴们都迷惑了。。。

2.    mmap syscall

这里以SLES11 SP2 3.0.80内核,ext4文件系统为例。ext4文件系统file_operations=ext4_file_operations,对应的mmap函数为ext4_file_mmap.

 

mm/mmap.c mmap_pgoff---->do_mmap_pgoff---->mmap_region---->file->f_op->mmap---->ext4_file_mmap---->vma->vm_ops = &ext4_file_mmap.

设置vm_ops.fault=filemap_fault; vm_ops.page_mkwrite=ext4_page_mkwrite

 

3.    write for first time

第一次写相应的页面的使用,由于页面还没有到内存中,所有会触发缺页异常

do_page_fault-->handle_mm_fault-->handle_pte_offset

因为vma->vm_ops不为空,所以进入 do_linear_fault

 

do_linear_fault---->__do_fault---->vma->vm_ops->fault---->filemap_fault

这里等待从磁盘读取页面到pagecache。处理完成后,由于使用SHARED模式mmap,所以会进入vma->vm_ops->page_mkwrite

 

vma->vm_ops->page_mkwrite---->ext4_page_mkwrite

这里会lock_page()wait_on_page_writeback(),如果恰好页面被其他进程锁定或者正在写回,那么会block,由于是第一次读取页面,所以一般不会在这里block

4.    page writeback

write_cache_pages---->clear_page_dirty_for_io---->page_mkclean---->page_mkclean_file---->page_mkclean_one---->pte_wrprotect

这里会将正在写回的页置为写保护,当页面回写完成后清除标志。

5.    write page which is writebacking

由于页面被回写线程置为写保护,对页面的写操作同样会触发do_page_fault,从而走到上面的流程。

do_page_fault---->handle_mm_fault--->handle_pte_fault

handle_pte_fault中有如下代码:

if flags & FAULT_FLAG_WRITE {

            if(!pte_write(entry))

                   return do_wp_page(mm, …)

entry = pte_mkdirty(entry);

}

 

如果用户尝试写页面(FLAULT_FLAG_WRITE),并且pte是写保护的,那么就会调用do_wp_page,而do_wp_page里面会对写且共享的vma的页面调用page_mkwrite

 

page_mkwrite里面会调用lock_pagewait_on_page_writeback(),从而导致等待页面写回后才可以完成写操作。

6.    mmap manual

如果使用SHARE共享模式mmap文件,那么对这块内存的操作是无法保证实时性的。如果磁盘io比较大,可能导致回写页面耗费几百ms,对应的内存操作也就会被block几百ms

阅读(4729) | 评论(0) | 转发(1) |
给主人留下些什么吧!~~