Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1253227
  • 博文数量: 185
  • 博客积分: 495
  • 博客等级: 下士
  • 技术积分: 1418
  • 用 户 组: 普通用户
  • 注册时间: 2012-09-02 15:12
个人简介

治肾虚不含糖,专注内核性能优化二十年。 https://github.com/KnightKu

文章分类

全部博文(185)

文章存档

2019年(1)

2018年(12)

2017年(5)

2016年(23)

2015年(1)

2014年(22)

2013年(82)

2012年(39)

分类: LINUX

2013-09-16 15:04:58

F2FS文件系统简介

F2FS (Flash Friendly File System) 是专门为基于 NAND 的存储设备设计的新型开源 flash 文件系统。特别针对NAND 闪存存储介质做了友好设计。F2FS 201212月进入Linux 3.8 内核。目前,F2FS仅支持Linux操作系统。

F2FS 选择 log-structured文件系统方案,并使之更加适应新的存储介质(NAND)。同时,修复了旧式日志结构文件系统的一些已知问题,如(1) wandering tree 的滚雪球效应和(2)高清理开销。

根据内部几何结构和闪存管理机制(FTL),闪存存储设备有很多不同的属性,所以F2FS的设计者增加了多种参数,不仅用于配置磁盘布局,还可以选择分配和清理算法,优化性能(并行IO提高性能)

1.1 F2FS文件系统的设计背景和要解决的主要问题

1.1.1 LFSLog-strctured File System

为管理磁盘上的大的连续的空间以便快速写入数据,将 log 切分成 Segments,使用 Segment Cleaner 从重度碎片化的 Segment 中转移出有效的信息,然后将该 Segment 清理干净用于后续写入数据。

1.1.2 Wandering Tree 问题

LFS 中,当文件的数据块被更新的时候是写到 log 的末尾,该数据块的直接指针也因为数据位置的改变而更改,然后间接指针块也因为直接指针块的更新而更新。按照这种方式,上层的索引结构,如 inodeinode map 以及 checkpoint block 也会递归地更新。这就是所谓的 wandering tree 问题。为了提高性能,数据块更新的时候应该尽可能地消除或减少wandering tree 的更新节点传播。


1.1.3 Cleaning 开销

为了产生新的 log 空闲空间,LFS 需要回收无效的数据块,释放出空闲空间,这一过程称为 Cleaning 过程。Cleaning 过程包含如下操作:

(1)    通过查找 segment 使用情况链表,选择一个 segment

(2)    通过 segment summary block 识别出选中的 segment 中的所有数据块的父索引结构并载入到内存;

(3)    检查数据及其父索引结构的交叉引用;

(4)    选择有效数据进行转移有效数据。

Cleaning  工作可能会引起难以预料的长延时,因而 LFS 要解决的一个重要问题是对用户隐藏这种延时,并且应当减少需要转移的数据的总量以及快速转移数据。

2 F2FS文件系统特性和功能


2.1 F2FS不支持的特性和功能(后续可能会支持)

当前F2FS不支持如下的特性,但是这些特性在以后如果必要的话也会支持:

(1)    快照

(2)    用户配额——最难实现

(3)    不支持NFS

(4)    不支持“security”方面的扩展特性(xattrs)


2.2 F2FS的特性和功能

F2FS具有以下特性和功能:

(1)    最大文件系统16TB

(2)    32位块寻址空间;

(3)    最大文件大小3.94TB

(4)    Log-structured

(5)    Flash 感知

a) 扩大随机写区域(元数据区域,two-location)以获取更好的性能;

b) 尽量使 F2FS 的数据结构与 FTL 的运算部件对齐。

(6)    解决Wandering Tree 问题

a) 用术语“node”表示 inode 以及各种索引指针块;

b) 引入 Node Address Table (NAT) 包含所有“node”块的位置,这将切断数据块更新的递归传播。

(7)    最小化Cleaning 开销

a) 支持后台 Cleaning 进程;

b) 支持 greedy 和 低成本(转移数据最少)的待清理 Section 选择算法;

c) 支持 multi-head logs 用于动态/静态 hot cold 数据分离;

d) 引入自适应 logging 用于有效块分配。

阅读(21694) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~