F2FS

✍ dations ◷ 2025-04-03 10:33:09 #快闪存储器档案系统,嵌入式Linux,Linux档案系统

F2FS(英语:Flash-Friendly File System)是一种闪存文件系统,主要由金载极(韩语:김재극)在三星集团研发,适合Linux内核使用。

此文件系统起初是为了NAND闪存的存储设备设计(诸如固态硬盘、eMMC和SD卡),这些设备广泛存在于自移动设备至服务器领域。

三星应用了日志结构文件系统的概念,使它更适合用于存储设备。

F2FS将整个卷分成多个段(segment),每个段固定为2 MB。一个节(section)由连续的段组成,一个区(zone)由一组节组成。默认情况下,节与区被设置为相同的大小,但用户可以用mkfs轻松修改大小。

F2FS将整个卷划分为六个区域,除了超级块(superblock)以外的所有区都由多个段组成,如下所述。

为了避免文件系统与闪存之间的对齐错误,F2FS将CP的起始块地址与段大小对齐。它还通过在SSA区域中预留一些段来将“主区”起始块地址与区的大小对齐。

F2FS使用检查点方案来维护文件系统的完整性。在挂载时,F2FS首先尝试扫描CP区域来查找最后的有效检查点数据。为了缩短扫描时间,F2FS只使用CP的两个副本。其中一个总是指示最后的有效数据,这被称为影子副本机制。除了CP之外,NAT和SIT也使用影子副本机制。为了保证文件系统的一致性,每个CP指向的NAT和SIT副本都是有效的。

关键的数据结构是“节点”。与传统的文件结构类似,F2FS有三种类型的节点:inode,直接节点,间接节点。F2FS将4 KB分配给一个inode块,其中包含923个数据块索引(data block indices),两个直接节点指针,两个间接节点指针,以及一个double间接节点指针,如下所述。一个直接节点块包含1018个数据块索引,而间接节点块包含1018个节点块索引。因此,一个inode块(即一个文件)涵盖:

4 KB × (923 + 2×1018 + 2×10182 + 10183) = 3.94 TB

注意,所有节点块都经NAT映射,因此每个节点的位置都经NAT转换。为了缓解漫游树问题,F2FS能够切断叶数据写入引起的节点更新传播。

一个目录条目(dentry)占用11个字节,由以下属性组成。

一个目录条目块由214个目录条目槽及文件名组成。有一个位图用于记录每个目录条目是否有效。一个目录条目块占用4 KB,结构如下:

目录条目块 (4 K) = 位图 (27 字节) + 保留 (3 字节) +                      目录项 (11 * 214 字节) + 文件名 (8 * 214 字节)

F2FS为目录结构实现了多级散列表,每一级有一个包含专用散列桶数的散列表,如下所示。“A(2B)”表示桶包含2个数据块。

level #0    A(2B)level #1    A(2B) - A(2B)level #2    A(2B) - A(2B) - A(2B) - A(2B)    ...level #N/2  A(2B) - A(2B) - A(2B) - A(2B) - A(2B) - ... - A(2B)    ...level #N    A(4B) - A(4B) - A(4B) - A(4B) - A(4B) - ... - A(4B)

当F2FS在一个目录中找一个文件名时,首先计算出该文件名的散列值,然后F2FS扫描级别#0的散列表一查找由文件名及其inode编号组成的目录条目。如果未找到,F2FS继续查找级别#1的散列表。F2FS通过此方法逐级扫描由1至N的每层散列表。在每一层中,F2FS只需扫描由以下等式确定的一个桶(bucket),因此展现出 O(log(# of files)) 的复杂度。

 级别#n中要扫描的桶(bucket)数 = (散列值) % (级别#n中的桶数)

在创建文件时,F2FS找到一个能涵盖文件名的空的连续槽。F2FS以同样的方式由1至N查找各级散列表中的空槽。

在运行时,F2FS在“主要区域:”内管理六个活动日志:热/暖/冷节点和热/暖/冷数据。

基于日志的文件系统(LFS)有两种空闲空间管理方案:穿插记录(threaded log)与复制并压缩(copy-and-compaction)。后者也称为清理(cleaning),很适合有良好顺序写入性能的设备,因为空闲空间总用于写入新数据。但它会在发生高利用率时遭遇“清理”的开销。穿插记录则受到随机写入性能的影响,但没有“清理”过程。F2FS采用混合方案,默认采用“复制并压缩”,但根据文件系统的状态将策略动态变更为“穿插记录”方案。

为使F2FS与基于闪存的存储保持一致,F2FS以一个节(section)为单位分配一个段(segment)。F2FS预期节的大小与FTL中的垃圾收集单元大小相同。为考虑FTL中的映射粒度,F2FS将活动日志的每个节分配给尽可能多的不同区域。 FTL可以根据其映射粒度将活动日志数据写入一个分配单元。

F2FS在需要时和后台闲置时进行清理。按需清理在没有足够的空闲分段(segments)服务VFS调用时触发。后台清理器由一个内核线程执行,在系统空闲时触发清理作业。

F2FS支持两种受者选择策略:贪婪、成本效益算法。在贪心算法中,F2FS选择有最小有效块数的受者段。在成本效益算法中,F2FS根据段的年龄和有效块数量选择受者段,以解决贪心算法中存在的日志块抖动问题。F2FS使用贪心算法进行按需清理,后台清理器则使用成本效益算法。

为识别受者段中的数据是否有效,F2FS管理了一个位图,其中用一个比特表示一个块的有效性,覆盖主区域所有块的比特流组成了该位图。

相关

  • 坎帕尼亚坎帕尼亚(意大利语:Campania,意大利语发音:)是意大利南部的一个大区,西北临拉齐奥大区,北界临莫利塞大区,东北临普利亚大区,东界临巴斯利卡塔大区及西临第勒尼安海。大区面积13,590平
  • 小联盟美国职业棒球小联盟(英语:Minor League Baseball, MiLB),简称美国职棒小联盟或小联盟,是美国职业棒球的一种等级制度以及伞状组织,依附于美国职棒大联盟之下并设立各个等级;此制度
  • 亚历山大三世桥亚历山大三世桥(Pont Alexandre III)是法国巴黎跨越塞纳河的一座拱桥,连接右岸的香榭丽舍大街地区和左岸的荣军院和艾菲尔铁塔地区,普遍认为是巴黎最华丽的桥梁 。亚历山大三世
  • 朝鲜正祖朝鲜正祖(朝鲜语:조선 정조/朝鮮 正祖 Joseon Jeongjo;1752年10月28日(农历9月22日)-1800年8月18日(农历6月28日)),名讳李祘(朝鲜语:이산/李祘 Yi San),朝鲜王朝的第22代君主,1776年至1800
  • 平州平州,中国西晋时设置的州。东汉时于东北方仅设幽州;汉献帝时,公孙度自称为平州州牧。三国曹魏分辽东郡、昌黎郡、玄菟郡、带方郡、乐浪郡五郡为平州,之后又合并为幽州。西晋咸宁
  • 胡卫东胡卫东(1970年1月3日-)是江苏徐州人,中国篮球运动员;身高1.98米,司职得分后卫,战袍号码为8号。在中国篮坛号称“中国乔丹”。胡卫东1985年加入江苏省青年队,1987年加入国家青年队,199
  • 发情发情周期,又名动情周期,是雌性有胎盘哺乳类动物拥有的一种经常性生理变化,由身体的性激素所诱导产生。自前一次排卵期至下一次排卵期之间的时间长度称为一个周期。动物体内的各
  • 马来亚虎Panthera tigris malayensis马来亚虎(学名:Panthera tigris jacksoni)俗称马来虎,是2004年新确认的老虎亚种,分布于马来半岛南部的马来西亚与泰国境内,此前一直被归类为印度支那虎
  • 索尼音乐娱乐索尼音乐娱乐(英语:Sony Music Entertainment),简称索尼音乐(Sony Music)或SME,是索尼公司旗下音乐事业群,总部位于美国纽约市,为全球第二大唱片公司,也是全球三大唱片公司之一。2019
  • 1930年美国人口普查1930年美国人口普查(英语:1930 United States Census)是美国历史上第15次全国人口普查,确定了美国的常住人口为122,775,046人,相比1920年美国人口普查,同比增长为13.7%。1930年的