文件系统是一种用来存储和组织计算机文件、目录及其包含的数据的方法,它使文件、目录以及数据的查找和访问得到简化。如果您正在使用一台计算机,很可能使用了多个文件系统。文件系统能提供丰富的扩展能力。它可以编写成底层文件系统的一个封装程序,从而对其中的数据进行管理,并提供一个增强的、具有丰富特性的文件系统(例如 cvsfs-fuse,它为 CVS 提供了一个文件系统的接口;或 Wayback 文件系统,它提供了一种用于保留原始数据文件的文件备份机制)。
在用户空间的文件系统出现之前,文件系统的开发曾是内核开发人员的工作。创建文件系统需要了解内核编程和内核技术(例如 vfs)方面的知识。调试则需要 C 和 C++ 方面的专业技能。但是其他开发人员需要熟练地操作文件系统以添加个性化特性(例如添加历史记录或转发缓存)及对其改进。
使用 FUSE 您可以开发功能完备的文件系统:其具有简单的 API 库,可以被非特权用户访问,并可以安全的实施。更重要的是,FUSE 以往的表现充分证明了其稳定性。
使用 FUSE,您可以像可执行二进制文件一样来开发文件系统,它们需要链接到 FUSE 库上 —— 换言之,这个文件系统框架并不需要您了解文件系统的内幕和内核模块编程的知识。
就文件系统来说,用户空间的文件系统就不再是新奇的设计了。用户空间文件系统的商业实现与学术实现的实例包括:
- LUFS 是一个混合用户空间的文件系统框架,它对用于任何应用程序无数的文件系统提供透明支持。大部分LUFS 包括一个内核模块和一个用户空间的守护进程。从根本上来说,它将大部分 VFS 调用都委托给一个专用的守护进程来处理。
- UserFS 让用户进程可以像普通的文件系统一样进行加载。这种概念性的原型提供了 ftpfs,这可以使用文件系统接口提供匿名 FTP 访问。
- Ufo Project 是为 Solaris 提供的一个全局文件系统,它允许用户将远程文件真正当作本地文件一样对待。
- OpenAFS 是 Andrew FileSystem 的一个开源版本。
- CIFS 是 Common Internet FileSystem 的简称。
与这些商业实现和学术实现不同,FUSE 将这种文件系统的设计能力带到了 Linux 中来。由于 FUSE 使用的是可执行程序(而不像 LUFS 一样使用的是共享对象),因此可以简化程序的调试和开发。FUSE 可以在 2.4.x 和 2.6.x 的内核上使用,现在可以支持 Java™ 绑定,因此您可以不必限定于使用 C 和 C++ 来编写文件系统了。(有关更多使用 FUSE 的用户层的文件系统的内容,请参阅 参考资料。)
要在 FUSE 中创建一个文件系统,您需要安装一个 FUSE 内核模块,然后使用 FUSE 库和 API 来创建自己的文件系统。
回页首
要开发一个文件系统,首先请下载 FUSE 的源代码(请参阅 参考资料)并展开这个包:tar -zxvf fuse-2.2.tar.gz。这会创建一个 FUSE 目录,其中保存的是源代码。fuse-2.2 目录的内容如下:
- ./doc 包含了与 FUSE 有关的文档。现在,这只有一个文件 how-fuse-works。
- ./kernel 包含了 FUSE 内核模块的源代码(对于使用 FUSE 开发文件系统来说,您当然不用懂得这些代码的机制)。
- ./include 包含了 FUSE API 头,您需要这些文件来创建文件系统。您现在唯一需要的就是 fuse.h。
- ./lib 中存放的是创建 FUSE 库的源代码,您需要将它们与您的二进制文件链接在一起来创建文件系统。
- ./util 中存放的是 FUSE 工具库的源代码。
- ./example 当然包含的是一些供您参考的例子,例如 fu***mp.null 和 hello 文件系统。
回页首
- 在 fuse-2.2 目录中运行 configure 脚本: ./configure。这会创建所需要的 makefile 等内容。
- 运行 ./make 来编译库、二进制文件和内核模块。查看 kernel 目录中的文件 ./kernel/fuse.ko —— 这是内核模块文件。还要查看 lib 目录中的 fuse.o、mount.o 和 helper.o。
- 运行 ./make install 完成 FUSE 的安装。
另外一种选择:如果您希望使用 insmod 自己将这个模块安装到内核中,就可以跳过这个步骤。例如:/usr/local/sbin/insmod ./kernel/fuse.ko 或 /sbin/insmod ./kernel/fuse.ko。记住要使用 root 特权才能安装所需要的模块。
如果希望,只在一个步骤中就可以完成上面的步骤。在 fuse-2.2 目录中,运行 ./configure; make; make install;。
重要提示:在编译 FUSE 时,系统中需要有内核头文件或源代码。为了简单起见,请确保将内核源代码放到 /usr/src/ 目录中。
回页首
现在让我们来创建一个文件系统,这样就可以使用一个较旧的 Linux 内核来访问一个具有最新内核的 Linux 系统上的 AFS 空间了。您需要两个进程:一个是在较旧的 Linux 内核上运行的服务器进程,另外一个是在具有最新内核的 Linux 系统上运行的一个 FUSE 客户机进程。不论何时请求到达您的 FUSE 客户机进程上时,它都会与远程服务器进程进行联系。为了进行通信,这个文件系统使用了 RX RPC 代码,这是 AFS 的一部分,因此您需要编译 OpenAFS。(图 1 给出了对这个 AFS 文件系统的概述。)
- 下载 OpenAFS Linux 源代码并展开源代码。
在展开源代码的目录中,运行 ./make ./configure --enable-transarc-paths。如果 ./configure 无法理解编译使用的 sysname,就请使用 --with-afs-sysname 选项提供正确的 sysname。
要在 Linux 2.4 内核上编译,请使用下面的命令:./configure --enable-transarc-paths --with-afs-sysname=i386_linux24。
- 运行 ./make,然后运行 ./make dest。检查在编译过程中出现的错误。
如果编译过程一切顺利,那么 AFS 源代码树就可以使用了。现在,您需要准备一个开发目录 afsfuse。在这个目录中,创建另外两个目录:
- include 目录包括 OpenAFS 和 FUSE 的 include 目录的头文件。
- lib 目录包含 OpenAFS 和 FUSE 的库文件。
- 拷贝头文件和库文件。
首先从 OpenAFS 目录中拷贝 AFS 的头文件,方法是将 dest\i386_linux24\include 中的目录和文件全部拷贝到 include 目录中。然后将 fuse-2.2 目录中的 FUSE 的 include 目录拷贝到这个目录中。对库文件也重复相同的步骤,将它们全部拷贝到 lib 目录中。
- 创建应用程序的结构。
对于这两组进程,您需要使用两组文件。使用命名规则 afsfuse_client.* 来命名客户机进程的文件;使用命名规则afsfuse_server.* 来命名服务器进程的文件。
这样您就有了一个 afsfuse_client.c 文件,其中包含了 FUSE 进程的代码;一个 afsfuse_server.c 文件,其中包含了在远程机器上运行的进程使用的服务器代码;一个 makefile;一个 rxgen 文件,用来创建 RPC 头文件(例如 afsfuse.xg)。
afsfuse_client.c 文件可以创建 afsfuse_client 进程代码, FUSE 文件系统调用它来创建文件系统(使用 fuse-2.2/example/fu***mp.c 来创建这个文件)。
要使用 FUSE 来创建一个文件系统,您需要声明一个 fuse_operations 类型的结构变量,并将其传递给 fuse_main 函数。fuse_operations 结构中有一个指针,指向在执行适当操作时需要调用的函数。清单 1 给出了 fuse_operations 结构。
struct fuse_operations {
int (*getattr) (const char *, struct stat *);
int (*readlink) (const char *, char *, size_t);
int (*getdir) (const char *, fuse_dirh_t, fuse_dirfil_t);
int (*mknod) (const char *, mode_t, dev_t);
int (*mkdir) (const char *, mode_t);
int (*unlink) (const char *);
int (*rmdir) (const char *);
int (*symlink) (const char *, const char *);
int (*rename) (const char *, const char *);
int (*link) (const char *, const char *);
int (*chmod) (const char *, mode_t);
int (*chown) (const char *, uid_t, gid_t);
int (*truncate) (const char *, off_t);
int (*utime) (const char *, struct utimbuf *);
int (*open) (const char *, struct fuse_file_info *);
int (*read) (const char *, char *, size_t, off_t, struct fuse_file_info *);
int (*write) (const char *, const char *, size_t, off_t,struct fuse_file_info *);
int (*statfs) (const char *, struct statfs *);
int (*flush) (const char *, struct fuse_file_info *);
int (*release) (const char *, struct fuse_file_info *);
int (*fsync) (const char *, int, struct fuse_file_info *);
int (*setxattr) (const char *, const char *, const char *, size_t, int);
int (*getxattr) (const char *, const char *, char *, size_t);
int (*listxattr) (const char *, char *, size_t);
int (*removexattr) (const char *, const char *);
};
|
这些操作并非都是必需的,但是一个文件系统要想正常工作,就需要其中的很多函数。您可以实现一个具有特殊目的的.flush、.release 或 .fsync 方法的功能完备的文件系统。(本文不会介绍任何 xattr 函数。)清单 1 中给出的函数如下所示:
- getattr: int (*getattr) (const char *, struct stat *);
这个函数与 stat() 类似。st_dev 和 st_blksize 域都可以忽略。st_ino 域也会被忽略,除非在执行 mount 时指定了 use_ino选项。
- readlink: int (*readlink) (const char *, char *, size_t);
这个函数会读取一个符号链接的目标。缓冲区应该是一个以 null 结束的字符串。缓冲区的大小参数包括这个 null 结束字符的空间。如果链接名太长,不能保存到缓冲区中,就应该被截断。成功时的返回值应该是 “0”。
- getdir: int (*getdir) (const char *, fuse_dirh_t, fuse_dirfil_t);
这个函数会读取一个目录中的内容。这个操作实际上是在一次调用中执行 opendir()、readdir()、...、closedir() 序列。对于每个目录项来说,都应该调用 filldir() 函数。
- mknod: int (*mknod) (const char *, mode_t, dev_t);
这个函数会创建一个文件节点。此处没有 create() 操作;mknod() 会在创建非目录、非符号链接的节点时调用。
- mkdir: int (*mkdir) (const char *, mode_t);
rmdir: int (*rmdir) (const char *);
这两个函数分别用来创建和删除一个目录。
- unlink: int (*unlink) (const char *);
rename: int (*rename) (const char *, const char *);
这两个函数分别用来删除和重命名一个文件。
- symlink: int (*symlink) (const char *, const char *);
这个函数用来创建一个符号链接。
- link: int (*link) (const char *, const char *);
这个函数创建一个到文件的硬链接。
- chmod: int (*chmod) (const char *, mode_t);
chown: int (*chown) (const char *, uid_t, gid_t);
truncate: int (*truncate) (const char *, off_t);
utime: int (*utime) (const char *, struct utimbuf *);
这 4 个函数分别用来修改文件的权限位、属主和用户、大小以及文件的访问/修改时间。
- open: int (*open) (const char *, struct fuse_file_info *);
这是文件的打开操作。对 open() 函数不能传递创建或截断标记(O_CREAT、O_EXCL、O_TRUNC)。这个函数应该检查是否允许执行给定的标记的操作。另外,open() 也可能在 fuse_file_info 结构中返回任意的文件句柄,这会传递给所有的文件操作。
- read: int (*read) (const char *, char *, size_t, off_t, struct fuse_file_info *);
这个函数从一个打开文件中读取数据。除非碰到 EOF 或出现错误,否则 read() 应该返回所请求的字节数的数据;否则,其余数据都会被替换成 0。一个例外是在执行 mount 命令时指定了 direct_io 选项,在这种情况中 read() 系统调用的返回值会影响这个操作的返回值。
- write: int (*write) (const char *, const char *, size_t, off_t, struct fuse_file_info *);
这个函数将数据写入一个打开的文件中。除非碰到 EOF 或出现错误,否则 write() 应该返回所请求的字节数的数据。一个例外是在执行 mount 命令时指定了 direct_io 选项(这于 read() 操作的情况类似)。
- statfs: int (*statfs) (const char *, struct statfs *);
这个函数获取文件系统的统计信息。f_type 和 f_fsid 域都会被忽略。
- flush: int (*flush) (const char *, struct fuse_file_info *);
这表示要刷新缓存数据。它并不等于 fsync() 函数 —— 也不是请求同步脏数据。每次对一个文件描述符执行 close() 函数时,都会调用 flush();因此如果文件系统希望在 close() 中返回写错误,并且这个文件已经缓存了脏数据,那么此处就是回写数据并返回错误的好地方。由于很多应用程序都会忽略 close() 错误,因此这通常用处不大。
注意:我们也可以对一个 open() 多次调用 flush() 方法。如果由于调用了 dup()、dup2() 或 fork() 而产生多个文件描述符指向一个打开文件的情况,就可能会需要这种用法。我们无法确定哪个 flush 操作是最后一次操作,因此每个 flush 都应该同等地对待。多个写刷新序列相当罕见,因此这并不是什么问题。
- release: int (*release) (const char *, struct fuse_file_info *);
这个函数释放一个打开文件。release() 是在对一个打开文件没有其他引用时调用的 —— 此时所有的文件描述符都会被关闭,所有的内存映射都会被取消。对于每个 open() 调用来说,都必须有一个使用完全相同标记和文件描述符的 release() 调用。对一个文件打开多次是可能的,在这种情况中只会考虑最后一次 release,然后就不能再对这个文件执行更多的读/写操作了。release 的返回值会被忽略。
- fsync: int (*fsync) (const char *, int, struct fuse_file_info *);
这个函数用来同步文件内容。如果 datasync 参数为非 0,那么就只会刷新用户数据,而不会刷新元数据。
- setxattr: int (*setxattr) (const char *, const char *, const char *, size_t, int);
getxattr: int (*getxattr) (const char *, const char *, char *, size_t);
listxattr: int (*listxattr) (const char *, char *, size_t);
removexattr: int (*removexattr) (const char *, const char *);
这些函数分别用来设置、获取、列出和删除扩展属性。
您的文件系统将如下所示:
afsfuse_client <--RX[RPC]--> afsfuse_server
|
afsfuse_client 会将传递给它的文件系统调用转发给另外一台机器上的 afsfuse_server。afsfuse_server 会对客户机传递给它的所有请求进行处理,并将结果返回给客户机。它会执行所有必需的工作。RPC 使用的机制是 RX。数据或原数据都不会涉及缓存的问题。
回页首
在继续之前,您需要先定义 RX RPC 层。要实现这种功能,请为 rxgen 创建一个 .xg 文件,用来描述代理和与 afsfuse_client.c 和 afsfuse_server.c 进行链接的桩代码。清单 2 显示了如何创建一个具有如下内容的 afsfuse.xg 文件:
#define MYMAXPATH 512
%#include
%#include
%#define SAMPLE_SERVER_PORT 5000
%#define SAMPLE_SERVICE_PORT 0
/* i.e. user server's port */
%#define SAMPLE_SERVICE_ID 4 /* Maximum number of requests that will be handled by this
service simultaneously */
/* This number will also be guaranteed to execute in parallel if no services' requests
are being processed */
%#define SAMPLE_MAX 2 /* Minimum number of requests that are guaranteed to be handled
immediately */
%#define SAMPLE_MIN 1 /* Index of the "null" security class in the sample service. This
must be 0 (there are N classes, numbered from 0. In this case,
N is 1) */
%#define SAMPLE_NULL 0 /********************** fuse4_file_info taken from fuse.h the
rxgen does not understands fuse.h mystat taken from man 2
mystat these are required again rxgen does not understand the
struct paras and will bump.. **********************/
struct my_file_info { /** Open flags. Available in open() and release() */
int flags; /** File handle. May be filled in by filesystem in
open(). Available in all other file operations */
unsigned int fh; /** In case of a write operation indicates if
this was caused by a writepage */
int writepage;
};
struct mystatfs {
afs_uint32 f_type; /* type of filesystem (see below) */
afs_uint32 f_bsize; /* optimal transfer block size */
afs_uint32 f_blocks; /* total data blocks in file system */
afs_uint32 f_bfree; /* free blocks in fs */
afs_uint32 f_bavail; /* free blocks avail to non-superuser */
afs_uint32 f_files; /* total file nodes in file system */
afs_uint32 f_ffree; /* free file nodes in fs */
afs_uint32 f_fsid1; /* file system id */
afs_uint32 f_fsid2; /* file system id */
afs_uint32 f_namelen; /* maximum length of filenames */
afs_uint32 f_spare[6]; /* spare for later */
};
struct mystat {
afs_uint32 st_dev; /* device */
afs_uint32 st_ino; /* inode */
afs_uint32 st_mode; /* protection */
afs_uint32 st_nlink; /* number of hard links */
afs_uint32 st_uid; /* user ID of owner */
afs_uint32 st_gid;/* group ID of owner */
afs_uint32 st_rdev; /* device type (if inode device) */
afs_uint32 st_size; /* total size, in bytes */
afs_uint32 st_blksize; /* blocksize for filesystem I/O */
afs_uint32 st_blocks; /* number of blocks allocated */
afs_uint32 st_atim; /* time of last access */
afs_uint32 st_mtim; /* time of last modification */
afs_uint32 st_ctim; /* time of last change */
};
struct my_dirhandle{
afs_uint32 type;
afs_uint32 inode;
char name[MYMAXPATH];
};
typedef my_dirhandle bulkmydirhandles<>;
/*********************phase 1 functions *********************************************/
rxc_getattr(IN string mypath, IN int dummy) split = 1;
rxc_getdirWrapper(IN string path, OUT bulkmydirhandles *handles) = 2;
rxc_read(IN string path;, IN afs_uint32 size, IN afs_uint32 offset,
IN struct my_file_info *fi) split = 3;
rxc_open(IN string path, IN int flags, OUT u_int *hd) = 4;
rxc_write(IN string path,IN afs_uint32 size, IN afs_uint32 offset,
IN struct my_file_info *fi) split = 5;
rxc_chmod(IN string path, IN afs_uint32 mode) = 6;
rxc_chown(IN string path, IN afs_uint32 uid, IN afs_uint32 gid) = 7;
rxc_utime(IN string path, IN afs_uint32 at,IN afs_uint32 mt) = 8;
rxc_mknod(IN string path, afs_uint32 mode, afs_uint32 rdev) = 9 ;
rxc_mkdir(IN string path, IN afs_uint32 mode) = 10;
rxc_unlink(IN string path) = 11 ;
rxc_rmdir(IN string path) = 12;
rxc_rename(IN string from, IN string to) = 13;
rxc_truncate(IN string path, IN afs_uint32 size) = 14;
rxc_release(IN string path, IN struct my_file_info *fi) = 15;
rxc_readlink(IN string path, IN afs_uint32 size,OUT string
data) = 16;
rxc_symlink(IN string from, IN string to) = 17;
rxc_link(IN string from, IN string to) = 18;
rxc_statfs(IN string path, OUT struct mystatfs *stbuf) = 19;
rxc_fsync(IN string path , IN int isdatasync, IN struct my_file_info
*fi) = 20 ;
rxc_flush(IN string path , IN struct my_file_info *fi) = 21 ;
|
在定义 RX RPC 层时,注意以下几点:
- 在 statfs、stat 和 fuse_file_info 基础上定义了 mystatfs、mystat 和 my_file_info 的封装程序。它们都会使用所生成的 XDR 代码进行转换。(XDR(External Data Representation,外部数据表示)允许采用一种与体系结构无关的方式进行封装,这样就可以在异构计算机系统之间传输数据了。)
- 您几乎要为 fuse_operations 结构的每个成员都定义一个函数,它们几乎具有相同的参数,因为 afsfuse_client 的工作就是负责接管 FUSE 文件系统中的调用,并将这些调用传递给 afsfuse_server。
- 您已经硬编码了一些值,例如 MYMAXPATH,这应该从系统中获得 —— 硬编码是为了简单性起见而这样做的。
回页首
接下来使用 rxgen 编译 afsfuse.xg 文件,从而创建客户机和存根文件。从包含 afsfuse_server 和 afsfuse_client 的源代码的目录中,运行命令 openafs-1.2.13/i386_linux24/dest/bin/rxgen afsfuse.xg。这会创建以下文件:
- afsfuse.cs.c 是与 afsfuse_client.c 进行链接的客户机存根代码。
- afsfuse.h 是包含您的 FUSE RX 代码的各种定义的头文件。
- afsfuse.ss.c 是与 afsfuse_server 代码进行链接的服务器存根代码(代理代码)。
- afsfuse.xdr.c 包含了用来处理在 afsfuse.xg 中定义的 3 个结构所使用的代码。
现在为 afsfuse_client.c 和 afsfuse_server.c 添加一些执行实际工作的代码。大部分调用都如下所示:
- Our_call_in_afs_fuse_client()。分析参数并准备执行 RPC。对 RX [RPC] 调用 afsfuse_server。组合参数。将这些值拷贝到传递给这个函数的行参数中。
- Our_call_in_afs_fuse_server()。组合参数。调用本地文件系统或 AFS 特有的函数。分析参数准备执行 RPC。生成 RX RPC 调用。
afsfuse_client.c 调用如下所示:
int afsfuse_readlink(const char *path, char *buf, size_t size){
rx_connection *local& int ret& char *buffer = malloc (512)&
memset(buffer,0,512)& memset(buf,0,size)& local = getconnection()&
ret = rxc_rxc_readlink(local,path,512,&buffer) // rpc call
relconnection(local)&
strncpy(buf,buffer,512-1)&
//<- demarshall the parametrs
return ret&
}
|
afsfuse_server.c 调用如下所示:
int rxc_rxc_readlink( struct rx_call *call, char * path, afs_uint32 size, char**data)
{ int ret& char lbuff[512] ={0}&
translatePath(path,lbuff)& //<- make filesystem call
*data = malloc(512)&
res = readlink(lbuff, *data, 512-1)&
if(res == -1) return -errno& (*data)[res] = '\0'& return 0&
}
|
简单地,您可以在其他函数中添加代码来对文件系统进行增强。
您需要创建一个 makefile 来编译代码。记住在编译 afsfuse_client 的代码时包括以下选项:-D_FILE_OFFSET_BITS=64 和 -DFUSE_USE_VERSION=22。
SRCDIR=./ LIBRX=${SRCDIR}lib/librx.a
LIBS=${LIBRX} ${SRCDIR}lib/liblwp.a
#CC = g++
CFLAGS=-g -I. -I${SRCDIR}include -I${SRCDIR}include/fuse/ -DDEBUG ${XCFLAGS}
-D_FILE_OFFSET_BITS=64 -DFUSE_USE_VERSION=22
afsfuse_client: afsfuse_client.o afsfuse.xdr.o ${LIBS} bulk_io.o afsfuse.cs.o
${CC} ${CFLAGS} -o afsfuse_client afsfuse_client.o ${SRCDIR}lib/fuse/fuse.o
${SRCDIR}lib/fuse/mount.o ${SRCDIR}lib/fuse/helper.o
${SRCDIR}lib/fuse/fuse_mt.o bulk_io.o afsfuse.cs.o afsfuse.xdr.o ${LIBS}
afsfuse_server: afsfuse_server.o afsfuse.xdr.o afsfuse.ss.o bulk_io.o ${LIBS}
${CC} ${CFLAGS} -o afsfuse_server afsfuse_server.o bulk_io.o afsfuse.ss.o
afsfuse.xdr.o ${LIBS}
#afsfuse_client.o: afsfuse.h
#afsfuse_server.o: afsfuse.h
bulk_io.o: ${CC} -c -g -I${SRCDIR}include bulk_io.c afsfuse.cs.c afsfuse.ss.c
afsfuse.er.c afsfuse.h afsfuse.xdr.c: afsfuse.xg rxgen afsfuse.xg
afsfuse.xdr.o: afsfuse.xdr.c ${CC} -c -g -I{SRCDIR}include afsfuse.xdr.c
all: afsfuse_server afsfuse_client
clean: rm *.o rm afsfuse_client rm afsfuse_server
|
记住,您仍然需要使用 librx.a 和 liblwp.a 链接到 RX 和 RX 使用的 LWP 代码上。fuse/fuse.o、fuse/helper.o 和 fuse/mount.o 都是代码需要链接的 FUSE 库。
回页首
在本文中,您已经学习了如何安装 FUSE 和 OpenAFS,以及如何使用它们来创建并定制自己的用户空间文件系统,它可以成为 Linux 中一个功能完备、稳定可靠的文件系统,这不需要对现有内核打任何补丁或重新编译 —— 您甚至都不需要成为内核模块程序员。您已经详细了解了启用 FUSE 文件系统的两个关键概念:如何安装和配置 FUSE 内核模块,以及如何充分利用 FUSE 库和 API 的功能。
http://www.ibm.com/developerworks/cn/linux/l-fuse/