分类: LINUX
2015-09-02 10:02:20
原文地址:F2FS文件系统架构与原理分析(一)——设计背景与功能 作者:登高望远海
F2FS (Flash Friendly File System) 是专门为基于 NAND 的存储设备设计的新型开源 flash 文件系统。特别针对NAND 闪存存储介质做了友好设计。F2FS 于2012年12月进入Linux 3.8 内核。目前,F2FS仅支持Linux操作系统。
F2FS 选择 log-structured文件系统方案,并使之更加适应新的存储介质(NAND)。同时,修复了旧式日志结构文件系统的一些已知问题,如(1) wandering tree 的滚雪球效应和(2)高清理开销。
根据内部几何结构和闪存管理机制(FTL),闪存存储设备有很多不同的属性,所以F2FS的设计者增加了多种参数,不仅用于配置磁盘布局,还可以选择分配和清理算法,优化性能(并行IO提高性能)。
为管理磁盘上的大的连续的空间以便快速写入数据,将 log 切分成 Segments,使用 Segment Cleaner 从重度碎片化的 Segment 中转移出有效的信息,然后将该 Segment 清理干净用于后续写入数据。
在 LFS 中,当文件的数据块被更新的时候是写到 log 的末尾,该数据块的直接指针也因为数据位置的改变而更改,然后间接指针块也因为直接指针块的更新而更新。按照这种方式,上层的索引结构,如 inode、inode map 以及 checkpoint block 也会递归地更新。这就是所谓的 wandering tree 问题。为了提高性能,数据块更新的时候应该尽可能地消除或减少wandering tree 的更新节点传播。
为了产生新的 log 空闲空间,LFS 需要回收无效的数据块,释放出空闲空间,这一过程称为 Cleaning 过程。Cleaning 过程包含如下操作:
(1) 通过查找 segment 使用情况链表,选择一个 segment;
(2) 通过 segment summary block 识别出选中的 segment 中的所有数据块的父索引结构并载入到内存;
(3) 检查数据及其父索引结构的交叉引用;
(4) 选择有效数据进行转移有效数据。
Cleaning 工作可能会引起难以预料的长延时,因而 LFS 要解决的一个重要问题是对用户隐藏这种延时,并且应当减少需要转移的数据的总量以及快速转移数据。
当前F2FS不支持如下的特性,但是这些特性在以后如果必要的话也会支持:
(1) 快照
(2) 用户配额——最难实现
(3) 不支持NFS
(4) 不支持“security”方面的扩展特性(xattrs)
F2FS具有以下特性和功能:
(1) 最大文件系统16TB;
(2) 32位块寻址空间;
(3) 最大文件大小3.94TB;
(4) Log-structured;
(5) Flash 感知
a) 扩大随机写区域(元数据区域,two-location)以获取更好的性能;
b) 尽量使 F2FS 的数据结构与 FTL 的运算部件对齐。
(6) 解决Wandering Tree 问题
a) 用术语“node”表示 inode 以及各种索引指针块;
b) 引入 Node Address Table (NAT) 包含所有“node”块的位置,这将切断数据块更新的递归传播。
(7) 最小化Cleaning 开销
a) 支持后台 Cleaning 进程;
b) 支持 greedy 和 低成本(转移数据最少)的待清理 Section 选择算法;
c) 支持 multi-head logs 用于动态/静态 hot 与 cold 数据分离;
d) 引入自适应 logging 用于有效块分配。