Coder
分类: LINUX
2010-07-25 00:09:47
进程是通过文件描述符(file
descriptor,fd)来访问文件的,每个进程最多能同时使用NR_OPEN个文件描述符,这个值在include/linux/limits.h中定义为1024。每一个进程用一个打开文件表files_struct来描述进程的文件描述符使用情况。每一个文件都有一个文件指针。
进程的task_struct中有文件系统相关的数据成员:
struct task_struct {
……
/* filesystem information */
struct fs_struct *fs;
/* open file information */
struct files_struct
*files;
……
};
结构fs_struct给出了与进程相关的文件系统的信息,比如进程自己的当前工作目录,它的根目录等,这个结构的定义为:
---------------------------------------------------------------------
include/linux/fs_struct.h
struct fs_struct {
int users;
rwlock_t lock; /* 用于表中字段的读/写自旋锁 */
int umask; /* 当打开文件设置文件权限时所使用的位掩码 */
int in_exec;
struct path root, pwd;
};
---------------------------------------------------------------------
其中path结构的root和pwd两个成员分别描述了进程最常用到的两个目录的信息,即根目录和当前目录,path结构定义如下:
---------------------------------------------------------------------
include/linux/path.h
struct path {
struct vfsmount *mnt;
struct dentry *dentry;
};
---------------------------------------------------------------------
mnt:描述目录所安装的文件系统对象
dentry:描述目录的目录项
还有一个表表示进程打开的文件,即task_struct结构的files_struct类型的files字段。它给出了所有的进程描述符的使用情况,其file结构指针数组成员给出了文件描述符的信息,其定义如下:
---------------------------------------------------------------------
include/linux/fdtable.h
struct files_struct {
/*
* read mostly part
*/
atomic_t count; /* 共享该表的进程数目 */
/* 文件描述符表 */
struct fdtable *fdt;
struct fdtable fdtab;
/*
* written part on a
separate cache line in SMP
*/
/* 用于表中字段的读/写自旋锁 */
spinlock_t file_lock
____cacheline_aligned_in_smp;
int next_fd; /* 所分配的最大文件描述符加1 */
/* 执行exec() 时需要关闭的文件描述符的集合 */
struct embedded_fd_set
close_on_exec_init;
/* 文件描述符的初始集合 */
struct embedded_fd_set
open_fds_init;
/* 文件对象指针的初始化数组 */
struct file *
fd_array[NR_OPEN_DEFAULT];
};
---------------------------------------------------------------------
在新的管理文件描述符的无锁模型中,锁机制是基于RCU的。文件描述表包含多个成员——fd sets(open_fds 和 close_on_exec, 文件指针数组, 文件描述符集和文件指针数组的大小)。为了使更新在一个无锁的读者看来是原子的,则文件描述符表的所有元素被放在一个单独的结构——struct fdtable中。
即,fdtable结构是进程的文件描述符表,其定义如下:
---------------------------------------------------------------------
include/linux/fdtable.h
struct fdtable {
unsigned int max_fds;
struct file ** fd; /* current fd array */
fd_set *close_on_exec;
fd_set *open_fds;
struct rcu_head rcu;
struct fdtable *next;
};
---------------------------------------------------------------------
fd字段指向文件对象指针数组。该数组的长度存放在max_fds中。通常,fd字段指向files_struct的fd_array字段,该字段包含32个文件对象指针。如果进程打开的文件数目多于32个,内核就分配一个新的、更大的文件指针数组,并将其地址放在fd中,内核也同时更新max_fds字段的值。
对于在fd数组中有元素的每个文件来说,数组的索引就是文件描述符。Unix进程将文件描述符作为主文件标识符。两个文件描述符可以指向同一个打开的文件。
进程不能使用多于NR_OPEN个文件描述符。open_fds字段最初包含open_fds_init字段的地址,open_fds_init表示当前已打开文件描述符的位图。max_fds字段存放位图中的位数。
fd_set结构是文件描述符集,它将同一种情况下的多个文件描述符放在一起。在include/linux/types.h有中定义:
typedef __kernel_fd_set fd_set;
__kernel_fd_set结构在include/linux/posix_types.h中定义:
typedef struct {
unsigned
long fds_bits [__FDSET_LONGS];
} __kernel_fd_set;
其中与__FDSET_LONGS有关的一些宏:
#define __NFDBITS (8 * sizeof(unsigned long))
#undef __FD_SETSIZE
#define __FD_SETSIZE 1024
#undef __FDSET_LONGS
#define __FDSET_LONGS (__FD_SETSIZE/__NFDBITS)
embedded_fd_set结构是小的文件描述符集,它将同一情况下的文件描述符放在一起,只能存放unsigned long类型位数个文件描述符,不过,这对于许多进程已经足够了。
/*
* The embedded_fd_set is a small fd_set,
* suitable for most tasks (which open <=
BITS_PER_LONG files)
*/
struct embedded_fd_set {
unsigned
long fds_bits[1];
};