0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GFS、AFS分布式文件系统

SSDFans 来源:ssdfans 2020-08-21 16:16 次阅读

GFS、AFS分布式文件系统

随着云计算在全球范围内的高速发展,谷歌、亚马逊等企业的崛起,特别是"互联网+"深入融合背景下的业务云化需求,传统企业在数据中心建设中被动地徘徊在传统存储阵列与分布式存储两种体系存储架构之间。这两种存储结构并没有绝对的优劣之分,而大数据的繁盛让分布式存储架构近几年中获得了前所未有的关注。

传统存储于分布式系统

传统SAN以高度的可靠性、稳定性和功能丰富性,在应用实践中获得了广泛认可。随着数据量不断增加,企业对于数据存储可扩展性提出要求,分布式存储系统逐步成为扩展性强、价格低廉的选择。

考量分布式存储的关键技术主要包括:全局名字空间、缓存一致性、安全性、可用性和可扩展性。从数据形态来划分,主要有:结构化数据、非机构化数据和半结构化数据。

GFS、AFS和Lustre成为主流的三种分布式存储文件系统。其中,GFS(Google file system)被称为谷歌文件系统,其性能、可扩展性、可靠性和可用性都收到了肯定,主要部件包括一个Master和n个chunkserver,和Chunk Server(数据块服务器)同时可以被多个客户Client访问。

GFS架构

不同于传统的文件系统,GFS不再将组建错误当成异常,而是将其看做一种常见情况予以处理。对待文件的大小一直是文件系统要考虑的问题,对于任何一种文件系统,成千上万的几KB的系统,总会压死内存,所以,对于大型的文件,管理要高效,对于小型文件也要支持,但是并没有进行优化。

在GFS中chunk server大小被固定为64MB,这样的块规模比一般的文件系统的块规模要大得多,可以减少元数据metadata开销,减少Master的交互,但太大的块规模也会产生内部碎片,或者同一个Chunk中存在多个小文件可能产生访问热点。

GFS主要运行在大量运行Linux系统的普通机器上,从而降低了其硬件成本。但一系列冗余备份、快速恢复等技术保证其正常和高效运行,GFS也是实现非结构化数据的主要技术和文件系统。

AFS是Andrew File System的简称。AFS将文件系统的可扩展性放在了设计和实践的首要位置,因此AFS拥有过很好的扩展性,能够轻松支持数百个节点,甚至数千个节点的分布式环境。AFS由卡内基美隆大学最初设计开发,目前已经相当成熟,用于研究和部分大型网络之上。

AFS概况

AFS主要组建包括:Cells、AFS clients、基本存储单元Volumes、AFS servers和Volume replication。AFS实现的是模块化的,并不要求在每台服务器上运行所有服务器进程。AFS拥有良好可扩展性,客户端华村能够带来性能的提升和可用性的提高、AFS的缺点在于管理员界面友好性不足,需要更多的专业知识来支持AFS。

Lustre平行分布式文件系统

Lustre是HP,Intel,Cluster File System公司联合美国能源部开发的Linux集群并行文件系统,名称来源于Linux和Clusters。同时Lustre也是一个遵循GPL许可协议的开源软件,Lustre也被称为平行分布式文件系统,常用于大型计算机集群和超级电脑中。

Lustre架构图

Lustre的主要组建包括:元数据服务器(Metadataservers, MDSs)、对象存储服务器(objectstorage servers, OSSs)和客户端。其中MDSs提供元数据服务,MGS管理服务器提供Lustre文件系统配置信息,OSS对象存储服务器expose块设备提供数据。

Lustre文件系统针对大文件读写进行了优化,能够提高性能的IO能力;在源数据独立存储、服务和网络失效的快速恢复、基于意图的分布式锁管理和系统可快速配置方面优异。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 云计算
    +关注

    关注

    39

    文章

    7774

    浏览量

    137353
  • 文件系统
    +关注

    关注

    0

    文章

    284

    浏览量

    19904
  • 分布式存储
    +关注

    关注

    4

    文章

    171

    浏览量

    19523

原文标题:这三种分布式存储文件系统你造吗?

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Linux根文件系统的挂载过程

    Linux根文件系统(rootfs)是Linux系统中所有其他文件系统和目录的起点,它是内核启动时挂载的第一个文件系统
    的头像 发表于 10-05 16:50 403次阅读

    如何修改buildroot和debian文件系统

    本文档主要介绍在没有编译环境的情况下,如何修改buildroot和debian文件系统方法,如在buildroot文件系统中添加文件、修改目录等文件操作,在debian
    的头像 发表于 07-22 17:46 458次阅读
    如何修改buildroot和debian<b class='flag-5'>文件系统</b>

    分布式SCADA系统的特点的组成

    在工业自动化和能源管理领域,SCADA(Supervisory Control And Data Acquisition)系统扮演着至关重要的角色。其中,分布式SCADA系统凭借其独特的结构和功能
    的头像 发表于 06-07 14:43 535次阅读

    华为分布式存储连续三年荣膺2024年Gartner“客户之选”

    近日,全球权威咨询与分析机构Gartner发布《2024年Gartner Peer InsightsTM 分布式文件系统与对象存储“客户之声”》报告,华为凭借其OceanStor分布式存储解决方案再次荣获“客户之选”殊荣,这已是
    的头像 发表于 05-24 10:12 708次阅读

    浪潮信息发布AS13000G7-N系列分布式全闪存储

    浪潮信息近日推出了专为大型AI模型优化的AS13000G7-N系列分布式全闪存储。该系列基于浪潮信息自研的分布式文件系统,结合新一代数据加速引擎DataTurbo,为用户提供卓越的存储解决方案。
    的头像 发表于 05-14 10:03 562次阅读

    浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列

    近日,浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎DataTurbo,
    的头像 发表于 05-08 09:38 554次阅读
    浪潮信息发布为大模型专门优化的<b class='flag-5'>分布式</b>全闪存储AS13000G7-N系列

    分布式能源是什么意思?分布式能源有什么优势?

    分布式能源指的是在用户端或靠近用户端的小型能源供应系统,它能够直接满足用户的多种能源需求,如电力、热能和冷能。
    的头像 发表于 04-29 17:26 2244次阅读

    分布式光伏监控系统解决方案

    分布式光伏发电系统的发电量,提高分布式光伏发电系统的利用率。发展分布式光伏发电对优化能源结构、实现“双碳目标”、推动节能减排、实现经济可持续
    的头像 发表于 04-22 15:56 966次阅读
    <b class='flag-5'>分布式</b>光伏监控<b class='flag-5'>系统</b>解决方案

    HarmonyOS实战案例:【分布式账本】

    Demo基于Open Harmony系统使用ETS语言进行编写,本Demo主要通过设备认证、分布式拉起、分布式数据管理等功能来实现。
    的头像 发表于 04-12 16:40 1313次阅读
    HarmonyOS实战案例:【<b class='flag-5'>分布式</b>账本】

    分布式大屏控制系统对网络环境的要求

    分布式大屏控制系统对网络环境的要求较高,主要是因为该系统需要实时传输大量的视频信号数据,以保证多个显示屏幕的同步显示。以下是几个关键的网络环境要求: 高带宽:分布式大屏控制
    的头像 发表于 01-29 14:52 574次阅读

    分布式大屏控制系统的应用场景

    分布式大屏控制系统具有广泛的应用场景,主要涉及以下几个方面: 监控指挥中心:如交通指挥中心、电力调度中心、应急指挥中心等,用于实时监控、调度和指挥,保证系统的安全、稳定、高效运行。 会议中心:在
    的头像 发表于 01-29 14:25 739次阅读

    分布式大屏控制系统的工作原理

    分布式大屏控制系统是一种基于分布式计算、云计算和大数据技术的控制系统,具有高效、稳定、灵活的特点。该系统通过将各个子
    的头像 发表于 01-29 14:24 746次阅读

    什么是分布式架构?

    分布式架构是指将一个系统或应用拆分成多个独立的节点,这些节点通过网络连接进行通信和协作,以实现共同完成任务的一种架构模式。这种架构模式旨在提高系统的可扩展性、可靠性和性能表现。 一、分布式
    的头像 发表于 01-12 15:04 1229次阅读
    什么是<b class='flag-5'>分布式</b>架构?

    【Vsan数据恢复】Vsan分布式存储虚拟磁盘文件丢失的数据恢复案例

    一套vsan分布式存储架构有数台服务器节点,该vsan分布式存储架构配置了固态硬盘和机械硬盘,固态硬盘作为缓存盘使用,机械硬盘作为容量盘使用。 机房供电异常导致服务器异常关机,工作人员重启服务器后发现vsan分布式存储逻辑架构
    的头像 发表于 01-03 16:39 617次阅读

    分布式锁的三种实现方式

    分布式锁的三种实现方式  分布式锁是在分布式系统中用于实现对共享资源进行访问控制的一种机制。分布式锁的实现需要考虑高可用性、高性能和正确性等
    的头像 发表于 12-28 10:01 895次阅读