从文件IO看Linux 的虚拟文件系统（二）-embededgood-ChinaUnix博客

嵌入式

首页　| 　博文目录　| 　关于我

embededgood

博客访问： 3066019
博文数量： 523
博客积分： 11908
博客等级：上将
技术积分： 5475
用户组：普通用户
注册时间： 2009-04-03 15:50

文章分类

全部博文（523）

RFID & NFC（2）
设备（2）
WIFI（2）
iPhone（25）

iPhone开发环境（10）

iPhone开发入门（15）
产品解决方案（3）

网络电话（3）
windowsCE（1）
windows（1）

大数据处理（0）
android（42）

Android文件系统（2）

Android boot.img（3）

Android系统移植（1）

Android启动流程（4）

SCons（0）

基础知识（1）

Android的底层库（1）

Android系统开发（24）

Android的linux内（5）

Android系统概述（1）
Linux（220）

linux守护进程（1）

Linux服务器开发（1）

仿真软件QEMU（0）

module_init和mod（4）

linux驱动层和应（4）

web server（1）

ELF格式（0）

断点续传（0）

Linux源代码管理（0）

NAND FLASH（2）

NOR FLASH（1）

MTD设备（1）

spin_lock（3）

linux进程调度（3）

构建文件系统（2）

linux系统移植（1）

linux C库函数（5）

I2C驱动开发（5）

linux-2.6.26内核（3）

IO端口和IO内存（4）

网卡驱动（5）

嵌入式linux应用（4）

linux启动综述（7）

linux下的多线程（3）

Linux下的多进程（4）

linux系统调用函（8）

用户空间和内核空（4）

linux MMU技术（5）

虚拟地址和物理地（5）

linux网络学习笔（0）

linux网络编程（7）

linux驱动分析（1）

Linux内核完全剖（1）

第七篇 Linux的高（5）

第三篇 Linux系统（0）

嵌入式系统程序可（4）

第五篇 Linux内核（15）

第二篇 ARM+Linux（2）

第一篇 Linux主机（1）

嵌入式Linux学习（1）

LCD设备驱动（4）

linux文件系统（7）

udev（4）

串口驱动（8）

Linux内核同步介（2）

中断和下半部（4）

块设备驱动（4）

字符设备驱动（7）

网络基本感念（9）

Linux驱动程序开（0）

Linux内核设计与（5）

linux网络编程（4）

linux内核（10）

linux其它（16）

linux应用程序开（3）

linux设备驱动（10）
电源管理及功耗（3）
总线技术（7）

CAN总线（2）

RS232，485，422（5）
工作生活（23）

大客户销售（2）
软件架构设计（3）
嵌入式图形界面（7）

minigui（2）

QT（4）
嵌入式操作系统（9）

线程（2）
嵌入式软件（85）

malloc和free（6）

this指针（0）

多态（1）

动态链接库（1）

参数传递（1）

XML（5）

基于对象的程序设（5）

表达式（2）

C++primer（2）

结构体与共用体（2）

指针（2）

C语言各种修饰符（13）

C++（7）

C语言（10）

高质量C，C++编程（7）

BSP板级支持包（1）

uboot（2）

bootloader（2）

vivi（4）

数据结构（2）

经典C程序100例（1）

Linux面试题（2）

C语言面试题（5）
vxworks（2）
英语（1）
其它（30）

打工还是创业？（3）

work（14）
嵌入式硬件（48）

PLC（0）

QUALCOMM（1）

Analog Circuit（1）

FPGA/CPLD（2）

MIPS（2）

ARM Cortex-M3（1）

powerpc（1）

xscale（1）

ARM Cortex A8（3）

单片机（13）

PCB布线设计（6）

PC104（1）

ARM（15）
ucos-ii（7）
未分配的博文（0）

文章存档

2019年（3）

2013年（4）

2012年（71）

2011年（78）

2010年（57）

2009年（310）

我的朋友

相关博文

从文件IO看Linux 的虚拟文件系统（二）

分类： LINUX

2009-04-14 20:48:04

2.2.6 对象间的联系

如上的数据结构并不是孤立存在的。正是通过它们的有机联系，VFS才能正常工作。如下的几张图是对它们之间的联系的描述。

如图5所示，被Linux支持的文件系统，都有且仅有一个file_system_type结构而不管它有零个或多个实例被安装到系统中。每安装一个文件系统，就对应有一个超级块和安装点。超级块通过它的一个域s_type指向其对应的具体的文件系统类型。具体的文件系统通过file_system_type中的一个域fs_supers链接具有同一种文件类型的超级块。同一种文件系统类型的超级块通过域 s_instances链接。

从图6可知：进程通过task_struct中的一个域files_struct files来了解它当前所打开的文件对象；而我们通常所说的文件描述符其实是进程打开的文件对象数组的索引值。文件对象通过域f_dentry找到它对应的dentry对象，再由dentry对象的域d_inode找到它对应的索引结点，这样就建立了文件对象与实际的物理文件的关联。最后，还有一点很重要的是, 文件对象所对应的文件操作函数列表是通过索引结点的域i_fop得到的。图6对第三部分源码的理解起到很大的作用。

基于VFS的文件I/O

到目前为止，文章主要都是从理论上来讲述VFS的运行机制；接下来我们将深入源代码层中，通过阐述两个具有代表性的系统调用sys_open()和sys_read()来更好地理解VFS向具体文件系统提供的接口机制。由于本文更关注的是文件操作的整个流程体制，所以我们在追踪源代码时，对一些细节性的处理不予关心。又由于篇幅所限，只列出相关代码。本文中的源代码来自于linux-2.6.17内核版本。

在深入sys_open()和sys_read()之前，我们先概览下调用sys_read()的上下文。图7描述了从用户空间的read()调用到数据从磁盘读出的整个流程。当在用户应用程序调用文件I/O read()操作时，系统调用sys_read()被激发，sys_read()找到文件所在的具体文件系统，把控制权传给该文件系统，最后由具体文件系统与物理介质交互，从介质中读出数据。

sys_open()系统调用打开或创建一个文件，成功返回该文件的文件描述符。图8是sys_open()实现代码中主要的函数调用关系图。

由于sys_open()的代码量大，函数调用关系复杂，以下主要是对该函数做整体的解析；而对其中的一些关键点，则列出其关键代码。

a. 从sys_open()的函数调用关系图可以看到，sys_open()在做了一些简单的参数检验后，就把接力棒传给do_sys_open()：

1）、首先，get_unused_fd()得到一个可用的文件描述符；通过该函数，可知文件描述符实质是进程打开文件列表中对应某个文件对象的索引值；

2）、接着，do_filp_open()打开文件，返回一个file对象，代表由该进程打开的一个文件；进程通过这样的一个数据结构对物理文件进行读写操作。

3）、最后，fd_install()建立文件描述符与file对象的联系，以后进程对文件的读写都是通过操纵该文件描述符而进行。

b. do_filp_open()用于打开文件，返回一个file对象；而打开之前需要先找到该文件：

1）、open_namei()用于根据文件路径名查找文件，借助一个持有路径信息的数据结构nameidata而进行；

2）、查找结束后将填充有路径信息的nameidata返回给接下来的函数nameidata_to_filp()从而得到最终的file对象；当达到目的后，nameidata这个数据结构将会马上被释放。

c.open_namei()用于查找一个文件：

1）、path_lookup_open()实现文件的查找功能；要打开的文件若不存在，还需要有一个新建的过程，则调用 path_lookup_create()，后者和前者封装的是同一个实际的路径查找函数，只是参数不一样，使它们在处理细节上有所偏差；

2）、当是以新建文件的方式打开文件时，即设置了O_CREAT标识时需要创建一个新的索引节点，代表创建一个文件。在vfs_create()里的一句核心语句dir->i_op->create(dir, dentry, mode, nd)可知它调用了具体的文件系统所提供的创建索引节点的方法。注意：这边的索引节点的概念，还只是位于内存之中，它和磁盘上的物理的索引节点的关系就像位于内存中和位于磁盘中的文件一样。此时新建的索引节点还不能完全标志一个物理文件的成功创建，只有当把索引节点回写到磁盘上才是一个物理文件的真正创建。想想我们以新建的方式打开一个文件，对其读写但最终没有保存而关闭，则位于内存中的索引节点会经历从新建到消失的过程，而磁盘却始终不知道有人曾经想过创建一个文件，这是因为索引节点没有回写的缘故。

3）、path_to_nameidata()填充nameidata数据结构；

4）、may_open()检查是否可以打开该文件；一些文件如链接文件和只有写权限的目录是不能被打开的，先检查nd->dentry-> inode所指的文件是否是这一类文件，是的话则错误返回。还有一些文件是不能以TRUNC的方式打开的，若nd->dentry-> inode所指的文件属于这一类，则显式地关闭TRUNC标志位。接着如果有以TRUNC方式打开文件的，则更新nd->dentry-> inode的信息

3.1.1__path_lookup_intent_open()

不管是path_lookup_open()还是path_lookup_create()最终都是调用 __path_lookup_intent_open()来实现查找文件的功能。查找时，在遍历路径的过程中，会逐层地将各个路径组成部分解析成目录项对象，如果此目录项对象在目录项缓存中，则直接从缓存中获得；如果该目录项在缓存中不存在，则进行一次实际的读盘操作，从磁盘中读取该目录项所对应的索引节点。得到索引节点后，则建立索引节点与该目录项的联系。如此循环，直到最终找到目标文件对应的目录项，也就找到了索引节点，而由索引节点找到对应的超级块对象就可知道该文件所在的文件系统的类型。从磁盘中读取该目录项所对应的索引节点；这将引发VFS和实际的文件系统的一次交互。从前面的VFS理论介绍可知，读索引节点方法是由超级块来提供的。而当安装一个实际的文件系统时，在内存中创建的超级块的信息是由一个实际文件系统的相关信息来填充的，这里的相关信息就包括了实际文件系统所定义的超级块的操作函数列表，当然也就包括了读索引节点的具体执行方式。当继续追踪一个实际文件系统ext3的ext3_read_inode()时，可发现这个函数很重要的一个工作就是为不同的文件类型设置不同的索引节点操作函数表和文件操作函数表。
8. ext3_read_inode

    void ext3_read_inode(struct inode * inode)
    {
       ……
       //是普通文件
       if (S_ISREG(inode->i_mode)) {
          inode->i_op = &ext3_file_inode_operations;
          inode->i_fop = &ext3_file_operations;
          ext3_set_aops(inode);
       } else if (S_ISDIR(inode->i_mode)) {
          //是目录文件
            inode->i_op = &ext3_dir_inode_operations;
            inode->i_fop = &ext3_dir_operations;
         } else if (S_ISLNK(inode->i_mode)) {
            // 是连接文件
            ……
         } else {
            // 如果以上三种情况都排除了，则是设备驱动
          //这里的设备还包括套结字、FIFO等伪设备
          ……
}

3.1.2 nameidata_to_filp子函数：__dentry_open

这是VFS与实际的文件系统联系的一个关键点。从3.1.1小节分析中可知，调用实际文件系统读取索引节点的方法读取索引节点时，实际文件系统会根据文件的不同类型赋予索引节点不同的文件操作函数集，如普通文件有普通文件对应的一套操作函数，设备文件有设备文件对应的一套操作函数。这样当把对应的索引节点的文件操作函数集赋予文件对象，以后对该文件进行操作时，比如读操作，VFS虽然对各种不同文件都是执行同一个read()操作界面，但是真正读时，内核却知道怎么区分对待不同的文件类型。

9. __dentry_open

static struct file *__dentry_open(struct dentry *dentry, struct vfsmount *mnt,
     int flags, struct file *f,
     int (*open)(struct inode *, struct file *))
    {
        struct inode *inode;
        ……
        //整个函数的工作在于填充一个file对象
        ……

         f->f_mapping = inode->i_mapping;
        f->f_dentry = dentry;
        f->f_vfsmnt = mnt;
        f->f_pos = 0;
        //将对应的索引节点的文件操作函数集赋予文件对象的操作列表
        f->f_op = fops_get(inode->i_fop);
        ……
        //若文件自己定义了open操作，则执行这个特定的open操作。
        if (!open && f->f_op)
           open = f->f_op->open;
        if (open) {
           error = open(inode, f);
           if (error)
              goto cleanup_all;
        ……
        return f;

sys_read()系统调用用于从已打开的文件读取数据。如read成功，则返回读到的字节数。如已到达文件的尾端，则返回0。图9是sys_read()实现代码中的函数调用关系图。

对文件进行读操作时，需要先打开它。从3.1小结可知，打开一个文件时，会在内存组装一个文件对象，希望对该文件执行的操作方法已在文件对象设置好。所以对文件进行读操作时，VFS在做了一些简单的转换后（由文件描述符得到其对应的文件对象；其核心思想是返回current->files-> fd[fd]所指向的文件对象），就可以通过语句file->f_op->read(file, buf, count, pos)轻松调用实际文件系统的相应方法对文件进行读操作了。

解决问题

跨文件系统的文件操作的基本原理

到此，我们也就能够解释在Linux中为什么能够跨文件系统地操作文件了。举个例子，将vfat格式的磁盘上的一个文件a.txt拷贝到ext3格式的磁盘上，命名为b.txt。这包含两个过程，对a.txt进行读操作，对b.txt进行写操作。读写操作前，需要先打开文件。由前面的分析可知，打开文件时，VFS会知道该文件对应的文件系统格式，以后操作该文件时，VFS会调用其对应的实际文件系统的操作方法。所以，VFS调用vfat的读文件方法将 a.txt的数据读入内存；在将a.txt在内存中的数据映射到b.txt对应的内存空间后，VFS调用ext3的写文件方法将b.txt写入磁盘；从而实现了最终的跨文件系统的复制操作。

一切皆是文件”的实现根本

不论是普通的文件，还是特殊的目录、设备等，VFS都将它们同等看待成文件，通过同一套文件操作界面来对它们进行操作。操作文件时需先打开；打开文件时， VFS会知道该文件对应的文件系统格式；当VFS把控制权传给实际的文件系统时，实际的文件系统再做出具体区分，对不同的文件类型执行不同的操作。这也就是“一切皆是文件”的根本所在。

总结

VFS即虚拟文件系统是Linux文件系统中的一个抽象软件层；因为它的支持，众多不同的实际文件系统才能在Linux中共存，跨文件系统操作才能实现。 VFS借助它四个主要的数据结构即超级块、索引节点、目录项和文件对象以及一些辅助的数据结构，向Linux中不管是普通的文件还是目录、设备、套接字等都提供同样的操作界面，如打开、读写、关闭等。只有当把控制权传给实际的文件系统时，实际的文件系统才会做出区分，对不同的文件类型执行不同的操作。由此可见，正是有了VFS的存在，跨文件系统操作才能执行，Unix/Linux中的“一切皆是文件”的口号才能够得以实现。

参考文献

[1].Claudia Salzberg Rodriguez, Gordon Fischer, Steven Smolski. The Linux Kernel Primer.机械工业出版社.2006.7

[2].Robert Love.Linux内核设计与实现(第二版).机械工业出版社.2007.1

[3].Stevens W.Richard.Unix环境高级编程(第二版).人民邮电出版社.2006

[4].杨芙清，陈向群.操作系统教程.北京大学出版社.2005.7

[5].Linux-2.6.17.13内核源代码

此为转载，出处为：

吴美清 (), 研究生, 北京大学软件与微电子学院

阅读(1316) | 评论(0) | 转发(0) |

上一篇：从文件IO看Linux 的虚拟文件系统（一）

下一篇：理解和认识udev

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6