Chinaunix首页 | 论坛 | 博客
  • 博客访问: 109619
  • 博文数量: 58
  • 博客积分: 67
  • 博客等级: 民兵
  • 技术积分: 10
  • 用 户 组: 普通用户
  • 注册时间: 2009-10-21 13:20
文章分类

全部博文(58)

文章存档

2014年(4)

2013年(54)

我的朋友

分类: LINUX

2013-08-26 19:41:45

原文地址:FAT文件系统学习记录一 作者:mournjust

这些天在看关于FAT文件系统的一些资料,思路有时混乱,有时又变得清晰起来。我想大抵学习的过程就是这样子吧。

首先在深入的了解FATlinux源码之前,需要了解一些FAT的原理。

  《FAT文件系统原理》

从这个的简单的介绍中可以了解到FAT文件系统的布局,FAT表的组织,目录的形式,长短文件目录项的关系等等。这些都是FAT文件系统的一些基本思想。

图一:FAT32的组织形式

为了了解FAT的格式,需要仔细而详细的阅读《FAT文件系统原理》的4.3  FAT表和数据的存储原则。后面继续将到了 FAT32 短文件目录和FAT32长文件目录的定义,关于长短文件目录项,可以在后面介绍源码的时候详细的解释。

从《FAT文件系统原理》可以看出FAT表中差不多是采用了一种编程语言中的链表技术来组织FAT表的。

图二:用winhex查看FAT32格式的SD卡的FAT表,该FAT32文件系统的簇大小为0x800,没有保留簇,所以FAT表从第2簇开始。

从上图可以看出,FAT32是以F8 FF FF FF 表示一个FAT表的开始。FAT表中的每一个表项为2个字节,存储的是文件接下来的数据在哪一个簇中。FAT表中以一个FF FF来表示一个文件的结束。从上表中可以看出,其中一个长文件A是从第0x4簇开始的,到第0x45簇结束(图二中红线部分)。接下来的80xFF表示存储的是4个小文件。同样其中一个文件B是从第0x48簇开始,到第0x89簇结束。那么有人就会要问,我怎么知道一个文件到底是从哪个簇开始的,总不至于搜索这个FAT表吧。

这个问题分两步来回答,其中一部分涉及到了FAT文件的目录表项。在linux中用结构体struct msdos_dir_entry来描述。另外一个涉及到了所谓的fatcache的结构体。

有人可能就有疑问了,像上面的文件A,它所占用的簇都是连续的,如果每次都是从第一个簇开始查找,这不是太麻烦了。可不可以将连续的簇合并?

下面就先从struct fat_cache结构体开始吧。

struct fat_cache {

//用于组成链表。

struct list_head cache_list;

//用于记录连续的簇,方便查找

int nr_contig; /* number of contiguous clusters */

//该簇在文件中的标号

int fcluster; /* cluster number in the file. */

//在簇在设备上的实际位置

int dcluster; /* cluster number on disk. */

};

其中成员nr_contig用于描述连续的簇的个数。struct list_head cache_list用于链表的链接。这个链表属于谁呢?答案是这个链表属于inode节点。(再次不多描述,如果对于VFS文件系统有一定了解,那么就很容易理解)。

fat_cacheFAT文件系统中一个使用频率很高的结构体,内核专门为该结构体建立一个slab缓存。

通过fat_cache_init函数来建立一个slab高速缓存。

int __init fat_cache_init(void)

{

fat_cache_cachep = kmem_cache_create("fat_cache",

sizeof(struct fat_cache),

0, SLAB_RECLAIM_ACCOUNT,

init_once, NULL);

if (fat_cache_cachep == NULL)

return -ENOMEM;

return 0;

}

通过fat_cache_destroy函数来销毁掉slab高速缓存。

void fat_cache_destroy(void)

{

if (kmem_cache_destroy(fat_cache_cachep))

printk(KERN_INFO "fat_cache: not all structures were freed\n");

}

这样的话,在需要分配fat_cache结构体的时候,内核通过fat_cache_free来从高速缓存中分配一个fat_slab结构体,通过函数fat_cache_free来将该fat_cache结构体返回给slab高速缓存。

FAT通过fat_cache_lookup从链表中查找一个文件簇在磁盘中的实际位置。

函数的输入参数为inode结构体,前面提到了,链表属于inode结构。参数fclus是指要查找的文件簇在该文件中的相对位置。但是另外的3个输入参数为指针,对此感到比较奇怪。struct fat_cache_id指针cid用于保持在链表中找到的离fclus最近的一个fat_cache的信息。那么cached_fcluscached_dclus呢?cached_fclus用于返回查找到离fclus最近的file cluster(cluster  number in file)cached_dclus用于返回查找到的离disk cluster(cluster number on disk)最近位置。在下面的代码中在细细解释。

static int fat_cache_lookup(struct inode *inode, int fclus,

    struct fat_cache_id *cid,

    int *cached_fclus, int *cached_dclus)

{

static struct fat_cache nohit = { .fcluster = 0, };

struct fat_cache *hit = &nohit, *p;

int offset = -1;

spin_lock(&MSDOS_I(inode)->cache_lru_lock);

//函数遍历与inode对应的msdos_inode_info结构体的cache_lru队列。这就是该inodefat_cache队列

list_for_each_entry(p, &MSDOS_I(inode)->cache_lru, cache_list) {

/* Find the cache of "fclus" or nearest cache. */

if (p->fcluster <= fclus && hit->fcluster < p->fcluster) {

hit = p;

//查看该hit是否包含了fclus,如果没包含,那么就继续查找该队列的下一个。那么问题出现了,如果该队列后面没有fat_cache了呢?

//这就是问题的关键了,如果没有找到能够包含该fclus,那么就返回离fclus最近的fat_cache。下面就没有办法了,只能从FAT表中一个一个的慢慢查找了。并将查找的结果通过fat_cache_merge或者fat_cache_add添加队列中去。(具体操作请看fat_get_cluster函数)

if ((hit->fcluster + hit->nr_contig) < fclus) {

offset = hit->nr_contig;

} else {

//如果该fclus 包含在其中,那么问题就变得很简单。

offset = fclus - hit->fcluster;

break;

}

}

}

//hit != &nohit,即该链表不为空

if (hit != &nohit) {

fat_cache_update_lru(inode, hit);

//注意CID中保持的是链表中最近的一个

cid->id = MSDOS_I(inode)->cache_valid_id;

cid->nr_contig = hit->nr_contig;

cid->fcluster = hit->fcluster;

cid->dcluster = hit->dcluster;

//返回在fat_cache中包含的离fclus最近的file cluster

*cached_fclus = cid->fcluster + offset;

*cached_dclus = cid->dcluster + offset;

}

spin_unlock(&MSDOS_I(inode)->cache_lru_lock);

return offset;

这样子通过每个inode节点(也就是每个文件)的fat_cache队列,可以快速的获得文件在磁盘上的位置。

上面的函数fat_cache_lookup从名字可以看出,它只是在cache中进行这样的查找过程中,这显然是不够的,因为cache是存在于内存中的,最初是不存在的,只能从FAT表中进行查找。

int fat_get_cluster(struct inode *inode, int cluster, int *fclus, int *dclus)

//该函数输入为inode以及要查找的文件的cluster 要返回的是该cluster在磁盘上对应的dclus

{

       struct super_block *sb = inode->i_sb;

       const int limit = sb->s_maxbytes >> MSDOS_SB(sb)->cluster_bits;

       struct fat_entry fatent;

       struct fat_cache_id cid;

       int nr;

       BUG_ON(MSDOS_I(inode)->i_start == 0);

       *fclus = 0;

       *dclus = MSDOS_I(inode)->i_start;

       if (cluster == 0)

              return 0;

       //首先尽量从cache中进行查找,这样可以节省很多时间的。

       if (fat_cache_lookup(inode, cluster, &cid, fclus, dclus) < 0) {

              /*

               * dummy, always not contiguous

               * This is reinitialized by cache_init(), later.

               */

              cache_init(&cid, -1, -1);

       }

       //剩下的工作只能从FAT表中一个一个的查找了,确实是一个一个查找,从后面的代码(*fclus)++;也可以看出来。

       fatent_init(&fatent);

//这样可能会出现两种情况

//1. *fclus  =  cluster即需要查找的cluster已经被包含在cache中,那么皆大欢喜,查找结束

//2.*fclus < cluster, cache中包含不完全,其中* dclus中返回的是离cluster最近的cluster在磁盘上位置。然后根据该dclusFAT表中查找

       while (*fclus < cluster) {

              /* prevent the infinite loop of cluster chain */

              if (*fclus > limit) {

                     fat_fs_error(sb, "%s: detected the cluster chain loop"

                                 " (i_pos %lld)", __func__,

                                 MSDOS_I(inode)->i_pos);

                     nr = -EIO;

                     goto out;

              }

              //根据dclusFAT表查找出,下一个cluster在磁盘上的位置。

              nr = fat_ent_read(inode, &fatent, *dclus);

              if (nr < 0)

                     goto out;

              else if (nr == FAT_ENT_FREE) {

                     fat_fs_error(sb, "%s: invalid cluster chain"

                                 " (i_pos %lld)", __func__,

                                 MSDOS_I(inode)->i_pos);

                     nr = -EIO;

                     goto out;

              } else if (nr == FAT_ENT_EOF) {

                     fat_cache_add(inode, &cid);

                     goto out;

              }

              (*fclus)++;

              *dclus = nr;

              if (!cache_contiguous(&cid, *dclus))

                     cache_init(&cid, *fclus, *dclus);

       }

       nr = 0;

//查找结束,需要将相应的结果添加到cache中,便于下一次查找

       fat_cache_add(inode, &cid);

out:

       fatent_brelse(&fatent);

       //最终返回文件cluster对应的磁盘cluster

       return nr;

}

说到fat_ent_read函数就不得不说struct fatent_operations结构体,因为这个函数用到了很多的函数指针,因为不同的FAT类型(FAT12FAT16FAT32)而不同。

struct fatent_operations {

       void (*ent_blocknr)(struct super_block *, int, int *, sector_t *);

  //对应的cluster所在的FAT表中的位置

       void (*ent_set_ptr)(struct fat_entry *, int);

       int (*ent_bread)(struct super_block *, struct fat_entry *,

                      int, sector_t);

       //用于读出一个block的内容,显然不管是数据读取还是

       //在获得文件的存储位置(FAT表中读取)都是需要

       //该函数的

       int (*ent_get)(struct fat_entry *);

//用于获得FAT表中的下一个cluster所在的位置

       void (*ent_put)(struct fat_entry *, int);

       int (*ent_next)(struct fat_entry *);

};

int fat_ent_read(struct inode *inode, struct fat_entry *fatent, int entry)

{

       struct super_block *sb = inode->i_sb;

       struct msdos_sb_info *sbi = MSDOS_SB(inode->i_sb);

       struct fatent_operations *ops = sbi->fatent_ops;

       int err, offset;

       sector_t blocknr;

       if (entry < FAT_START_ENT || sbi->max_cluster <= entry) {

              fatent_brelse(fatent);

              fat_fs_error(sb, "invalid access to FAT (entry 0x%08x)", entry);

              return -EIO;

       }

       fatent_set_entry(fatent, entry);

//要获得一个文件cluster对应的磁盘cluster要分为三步:

1.算出文件clusterFAT表中对应的位置,ent_blocknr完成

2.读出FAT表中的内容,ent_bread完成

3.获得对应的磁盘clusterent_get完成

       ops->ent_blocknr(sb, entry, &offset, &blocknr);

       if (!fat_ent_update_ptr(sb, fatent, offset, blocknr)) {

              fatent_brelse(fatent);

              err = ops->ent_bread(sb, fatent, offset, blocknr);

              if (err)

                     return err;

       }

       return ops->ent_get(fatent);

}

阅读(858) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~