什么是分布式文件系统-电子发烧友网

我们无时无刻不在使用文件系统，进行开发时在使用文件系统，浏览网页时在使用文件系统，玩手机时也在使用文件系统。

对于非专业人士来说，可能根本不知道文件系统为何物。因为，通常来说，我们在使用文件系统时一般不会感知到文件系统的存在。即使是程序开发人员，很多人对文件系统也是一知半解。

虽然文件系统经常不被感知，但是文件系统是非常重要的。在 Linux 中，文件系统是其内核的四大子系统之一；微软的 DOS（Disk Operating System，磁盘管理系统），核心就是一个管理磁盘的文件系统，由此可见文件系统的重要性。

常见文件系统及分类

其实文件系统发展到现在，其种类也丰富多样。比如，基于磁盘的普通本地文件系统除了 Ext4，还包括 XFS、ZFS 和 Btrfs 等。其中 Btrfs 和 ZFS 不仅可以管理一块磁盘，还可以实现多块磁盘的管理。不仅如此，这两个文件系统实现了数据的冗余管理，这样可以避免磁盘故障导致的数据丢失。除了对磁盘数据管理的文件系统，还有一些网络文件系统。也就是说，这些文件系统看似在本地，但其实数据是在远程的专门设备上。客户端通过一些网络协议实现数据的访问，如 NFS 和 GlusterFS 等文件系统。经过几十年的发展，文件系统的种类非常多，我们没有办法逐一进行介绍。下面就对主要的文件系统进行介绍。

本地文件系统

本地文件系统是对磁盘空间进行管理的文件系统，也是最常见的文件系统形态。从呈现形态上来看，本地文件系统就是一个树形的目录结构。本地文件系统本质上就是实现对磁盘空间的管理，实现磁盘线性空间与目录层级结构的转换，如下图所示。

从普通用户的角度来说，本地文件系统主要方便了对磁盘空间的使用，降低了使用难度，提高了利用效率。常见的本地文件系统有 Ext4、Btrfs、XFS 和 ZFS 等。

伪文件系统

伪文件系统是 Linux 中的概念，它是对传统文件系统的延伸。伪文件系统并不会持久化数据，而是内存中的文件系统。它是以文件系统的形态实现用户与内核数据交互的接口。常见的伪文件系统有 proc、sysfs 和 configfs 等。

在 Linux 中，伪文件系统主要实现内核与用户态的交互。比如，我们经常使用的 iostat 工具，其本质上是通过访问/proc/diskstats 文件获取信息的，如下图所示。而该文件正是伪文件系统中的一个文件，但其内容其实是内核中对磁盘访问的统计，它是内核某些数据结构的实例。

网络文件系统

网络文件系统是基于 TCP/IP 协议（整个协议可能会跨层）的文件系统，允许一台计算机访问另一台计算机的文件系统，就如访问本地文件系统一样。网络文件系统通常分为客户端和服务端，其中客户端类似本地文件系统，而服务端则是对数据进行管理的系统。网络文件系统的使用与本地文件系统的使用没有任何差别，只需要执行 mount 命令挂载即可。网络文件系统也有很多种类，如 NFS 和 SMB 等。

在用户层面，完成挂载后的网络文件系统与本地文件系统完全一样，看不出任何差异，对用户是透明的。网络文件系统就好像将远程的文件系统映射到了本地。如下图所示，左侧是客户端，右侧是文件系统服务端。

当在客户端对服务端导出的文件系统进行挂载后，服务端的目录树就成为客户端目录树的一颗子树。这个子目录对普通用户来说是透明的，不会感知到这是一个远程目录，但实际上读/写请求需要通过网络转发到服务端进行处理。

集群文件系统

集群文件系统本质上也是一种本地文件系统，只不过它通常构建在基于网络的SAN 设备上，且在多个节点中共享 SAN 磁盘。集群文件系统最大的特点是可以实现客户端节点对磁盘介质的共同访问，且视图具有一致性，如图 1-22 所示。这种视图的一致性是指，如果在节点 0 创建一个文件，那么在节点 1 和节点 2都可以马上看到。这个特性其实跟网络文件系统类似，网络文件系统也是可以在某个客户端看到其他客户端对文件系统的修改的。但是两者是有差异的，集群文件系统本质上还是构建在客户端的，而网络文件系统则是构建在服务端的。

同时，对于集群文件系统来说，其最大的特点是多个节点可以同时为应用层提供文件系统服务，特别适合用于业务多活的场景，通过集群文件系统提供高可用集群机制，避免因为宕机造成服务失效。

分布式文件系统

从本质上来说，分布式文件系统其实也是一种网络文件系统。在《计算机科学技术名词》中给出的定义为“一种文件系统，所管理的数据资源存储在分布式网络节点上，提供统一的文件访问接口”，可以看出，分布式文件系统与网络文件系统的差异在于服务端包含多个节点，也就是服务端是可以横向扩展的。从使用角度来说，分布式文件系统的使用与网络文件系统的使用没有太大的差异，也是通过执行 mount 命令挂载，客户端的数据通过网络传输到服务端进行处理。

我们发现常规的网络文件系统最大的缺点是服务端无法实现横向扩展。这个缺点对大型互联网应用来说几乎是不可容忍的。本文将介绍一下在互联网领域应用非常广泛的分布式文件系统。分布式文件系统最大的特点是服务端通过计算机集群实现，可以实现横向扩展，存储端的存储容量和性能可以通过横向扩展的方式实现近似线性的提升。

什么是分布式文件系统

分布式文件系统（Distributed File System，简称 DFS）是网络文件系统的延伸，其关键点在于存储端可以灵活地横向扩展。也就是可以通过增加设备（主要是服务器）数量的方法来扩充存储系统的容量和性能。同时，分布式文件系统还要对客户端提供统一的视图。也就是说，虽然分布式文件系统服务由多个节点构成，但客户端并不感知。在客户端来看就好像只有一个节点提供服务，而且是一个统一的分布式文件系统。

在分布式文件系统中，最出名的就是谷歌的 GFS。除此之外，还有很多开源的分布式文件系统，比较有名且应用比较广泛的分布式文件系统有 HDFS、GlusterFS、CephFS、MooseFS 和 FastDFS 等。

分布式文件系统的具体实现有很多方法，不同的文件系统通常用来解决不同的问题，在架构上也有差异。虽然分布式文件系统有很多差异，但是有很多共性的技术点。

分布式文件系统与网络文件系统的异同

在有些情况下，NFS 等网络文件系统也被称为分布式文件系统。但是在本文中，分布式文件系统是指服务端可以横向扩展的文件系统。也就是说，分布式文件系统最大的特点是可以通过增加节点的方式增加文件系统的容量，提升性能。

当然，分布式文件系统与网络文件系统也有很多相同的地方。比如，分布式文件系统也分为客户端的文件系统和服务端的服务程序。同时，由于客户端与服务端分离，分布式文件系统也要实现网络文件系统中类似 RPC 的协议。

另外，分布式文件系统由于其数据被存储在多个节点上，因此还有其他特点。包括但不限于以下几点。

支持按照既定策略在多个节点上放置数据。

可以保证在出现硬件故障时，仍然可以访问数据。

可以保证在出现硬件故障时，不丢失数据。

可以在硬件故障恢复时，保证数据的同步。

可以保证多个节点访问的数据一致性。

由于分布式文件系统需要客户端与多个服务端交互，并且需要实现服务端的容错，通常来说，分布式文件系统都会实现私有协议，而不是使用 NFS 等通用协议。

常见分布式文件系统

分布式文件系统的具体实现方法有很多，其实早在互联网兴盛之前就有一些分布式文件系统，如 Lustre 等。早期分布式文件系统更多应用在超算领域。

随着互联网技术的发展，特别是谷歌的 GFS 论文的发表，分布式文件系统又得到进一步的发展。目前，很多分布式文件系统是参考谷歌发布的关于 GFS 的论文实现的。比如，大数据领域中的 HDFS 及一些开源的分布式文件系统 FastDFS 和CephFS 等。

在开源分布式文件系统方面，比较知名的项目有大数据领域的 HDFS 和通用的CephFS 和 GlusterFS 等。这几个开源项目在实际生产中使用得相对比较多一些。接下来将对常见的分布式文件系统进行简要的介绍。

GFS

GFS 是谷歌的一个分布式文件系统，该分布式文件系统因论文 The Google File System广为世人所知。GFS 并没有实现标准的文件接口，也就是其实现的接口并不与 POSIX 兼容。但包含创建、删除、打开、关闭和读/写等基本接口。

GFS 集群节点包括两个基本角色：一个是 master，该角色的节点负责文件系统级元数据管理；另一个是 chunkserver，该角色的节点通常有很多个，用于存储实际的数据。GFS 对于文件的管理是在 master 完成的，而数据的实际读/写则可以直接与 chunkserver 交互，避免 master 成为性能瓶颈。

GFS 在实现时做了很多假设，如硬件为普通商用服务器、文件大小在数百兆甚至更大及负载以顺序大块读者为主等。其中，对于文件大小的假设尤为重要。基于该假设，GFS 默认将文件切割为 64MB 大小的逻辑块（chunk），每个 chunk 生成一个 64 位的句柄，由 master 进行管理。

这里需要重点强调的是，每个 chunk 生命周期和定位是由 master 管理的，但是chunk 的数据则是存储在 chunkserver 的。正是这种架构，当客户端获得 chunk 的位置和访问权限后可以直接与 chunkserver 交互，而不需要 master 参与，进而避免了master 成为瓶颈。

下图所示为 GFS 架构示意图。

除了 GFS，还有很多类似架构的分布式文件系统。比如，在大数据领域中的HDFS，它是专用于 Hadoop 大数据存储的分布式文件系统。其架构与 GFS 的架构类似，包含一个用于管理元数据的节点和多个存储数据的节点，分别为 namenode和datanode。

HDFS 主要用来进行大文件的处理，它将文件按照固定大小切割，然后存储到数据节点。同时为了保证数据的可靠性，这些数据被放到多个不同的数据节点。文件被切割的大小和同时放置数据节点的数量（副本数）是可配置的。

虽然 HDFS 是针对大文件设计的，但是也可以处理小文件。只不过对于小于切割单元的文件不进行切割。另外，HDFS 对小文件也做了一些优化，如 HAR 和SequenceFile 等方案，但 HDFS 终究不是特意为小文件设计的，因此在性能方面还有些欠缺。

除此之外，还有很多模仿 GFS 的开源分布式文件系统，如 FastDFS、MooseFS和 BFS 等。但大多数开源项目只实现了文件系统最基本的语义，严格来说不能称为分布式文件系统，更像是对象存储。

CephFS

有必要单独介绍一下 CephFS 的原因是 CephFS 不仅实现了文件系统的所有语义，而且实现了元数据服务的多活横向扩展。

CephFS 的架构与 GFS 的架构没有太大差别，其突出的特点是在架构方面将GFS 的单活 master 节点扩展为多活节点。不仅可以元数据多活，而且可以根据元数据节点的负载情况实现负载的动态均衡。这样，CephFS 不仅可以通过增加节点来实现元数据的横向扩展，还可以调整节点负载，最大限度地使用各个节点的 CPU资源。

同时，CephFS 实现了对 POSIX 语言的兼容，在客户端完成了内核态和用户态两个文件系统实现。当用户挂载 CephFS 后，使用该文件系统可以与使用本地文件系统一样方便。

GlusterFS

GlusterFS 是一个非常有历史的分布式文件系统，其最大的特点是没有中心节点。也就是 GlusterFS 并没有一个专门的元数据节点来管理整个文件系统的元数据。

GlusterFS 抽象出卷（Volume）的概念，需要注意的是，这里的卷与 Linux LVM中的卷并非同一个概念。这里的卷是对文件系统的一个抽象，表示一个文件系统实例。当我们在集群端创建一个卷时，其实是创建了一个文件系统实例。

GlusterFS 有多种不同类型的卷，如副本卷、条带卷和分布式卷等。正是通过这些卷特性的组合，GlusterFS 实现了数据可靠性和横向扩展的能力。

原文标题：从文件系统到分布式文件系统

文章出处：【微信公众号：strongerHuang】欢迎添加关注！文章转载请注明出处。

审核编辑：彭菁

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

接口

接口

+关注

关注
33

文章
8617

浏览量
151314
存储

存储

+关注

关注
13

文章
4320

浏览量
85912
文件系统

文件系统

+关注

关注
0

文章
286

浏览量
19920

原文标题：从文件系统到分布式文件系统

文章出处：【微信号：strongerHuang，微信公众号：strongerHuang】欢迎添加关注！文章转载请注明出处。

分布式文件系统和fastDFS

项目（1）（分布式文件系统、fastDFS，代码实现fastDFS 文件上传和下载）

发表于 05-10 08:51

一文解读在RTThread平台上使用DFS分布式文件系统

1、RTThread平台使用DFS文件系统　　简单介绍了一下DFS代码框架和如何在RTThread平台上使用DFS分布式文件系统。工作比较忙先把目前整理的发出来，希望对小伙伴们有帮助，也希望玩过

发表于 09-15 16:57

采用信任管理的分布式文件系统TrustFs

在传统的分布式文件系统中用户无法判断文件的可信任性，针对此问题提出采用信任管理的分布式文件系统TrustFs，使用数字签名对

发表于 04-02 08:57 •19次下载

海量邮件分布式文件系统的设计与实现

本文通过归纳分析已有的分布式系统体系结构，研究并设计了一个针对于海量邮件存储的分布式文件系统。受Google File System 架构的启发，针对单个元数据服务器带来的瓶颈问

发表于 01-09 13:56 •12次下载

分布式文件系统数据块聚类存储节能策略

针对分布式文件系统中由于数据块随机放置而导致的服务器利用率低、能耗管理复杂的问题，建立了数据块访问特征向量模型描述用户对数据块的随机访问，运用K-means算法对数据块进行聚类计算，根据计算结果将

发表于 01-17 13:37 •0次下载

基于分布式文件系统元数据操作优化

随着网络应用的迅速发展，网络时代数据规模越来越大，海量数据存储和大规模并发的I/O成为了分布式系统中的瓶颈。单机环境下的文件系统已经不能满足当前网络时代的大容量、高可靠性、高性能、高扩展性等需求

发表于 02-24 13:46 •0次下载

基于<b class='flag-5'>分布式</b><b class='flag-5'>文件系统</b>元数据操作优化

盘点一下这些常见的分布式文件系统

Alluxio是第一个基于内存的分布式文件系统，因此其相应速度也会超出普通的分布式文件系统很多，例如HDFS就比它慢数百倍。并且Alluxio和Spark也有良好的交互。最重要的是Al

发表于 08-15 16:25 •1.2w次阅读

盘点一下这些常见的<b class='flag-5'>分布式</b><b class='flag-5'>文件系统</b>

分布式文件系统的HDFS是什么

上篇文章已经讲到了，随着数据量越来越大，在一台机器上已经无法存储所有的数据了，那我们会将这些数据分配到不同的机器来进行存储，但是这就带来一个问题：不方便管理和维护

发表于 05-04 09:36 •3959次阅读

<b class='flag-5'>分布式</b><b class='flag-5'>文件系统</b>的HDFS是什么

解析夸克分布式文件系统如何实现资源共享

QKFILE—“夸克分布式文件系统”。简单点说，它是一个点对点的分布式文件系统（和比特币技术一样），通过底层协议，可以让存储在QKFILE系统

发表于 08-06 08:45 •4901次阅读

分布式文件系统主从式的伸缩性架构设计

Hadoop当中负责分布式存储的HDFS，被定义为分布式文件系统，对于进入到平台当中的数据，提供高效的、可容错、可扩展的数据存储，这得益于分布式文件

发表于 01-05 10:42 •1263次阅读

2021年12种最佳分布式文件系统和对象存储平台榜单

分布式文件系统存储利用单个并行文件系统将多个存储节点集群在一起。该系统提供一个名称空间和一个存储池，以并行提供多个主机的高带宽数据访问。然后，将数据

发表于 01-27 16:06 •7773次阅读

云存储中的Ceph分布式文件系统及节点选择

云存储中的￠eph分布式文件系统以其开原性和提供统一存储能力的特点在企业和科研领域得到广泛关注和应用。 CRUSH算法是eph分布式文件系统中的伪随机数据

发表于 03-31 10:46 •13次下载

分布式文件系统的设计框架

因为HDFS系统（分布式文件系统）可由数百或数千个存储文件数据片段的服务器组成，即HDFS系统包含较多的硬件设备，所以HDFS

发表于 03-20 11:37 •1040次阅读

分布式文件系统的设计原理是什么？

什么是分布式文件系统？分布式文件系统(DFS)是一种计算机文件系统，使用户能够从多个分布式位置存

发表于 10-17 17:35 •911次阅读

服务器数据恢复—Lustre分布式文件系统数据恢复案例

5台节点服务器，每台节点服务器上有一组RAID5阵列。每组RAID5阵列上有6块硬盘（其中1块硬盘设置为热备盘，其他5块硬盘为数据盘）。上层系统环境为Lustre分布式文件系统。机房天花板漏水

发表于 12-25 11:39 •118次阅读

搜索历史

什么是分布式文件系统

评论

分布式文件系统和fastDFS

一文解读在RTThread平台上使用DFS分布式文件系统

采用信任管理的分布式文件系统TrustFs

海量邮件分布式文件系统的设计与实现

分布式文件系统数据块聚类存储节能策略

基于分布式文件系统元数据操作优化

盘点一下这些常见的分布式文件系统

分布式文件系统的HDFS是什么

解析夸克分布式文件系统如何实现资源共享

分布式文件系统主从式的伸缩性架构设计

2021年12种最佳分布式文件系统和对象存储平台榜单

云存储中的Ceph分布式文件系统及节点选择

分布式文件系统的设计框架

分布式文件系统的设计原理是什么？

服务器数据恢复—Lustre分布式文件系统数据恢复案例