0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

分布式vs.集中式,存储架构如何选?

科讯视点 来源:科讯视点 作者:科讯视点 2022-05-09 10:08 次阅读

存储技术发展日新月异。一方面传统集中式SAN/NAS还在广泛使用,另一方面各类分布式存储产品已纷纷在新兴的海量数据场景中占据市场。如何根据业务需求选择合适的存储架构?分布式存储能否在所有场景都能取代传统集中式存储?请参考本文攻略。

传统集中式存储

传统SAN/NAS存储的硬件架构采用控制器+硬盘柜”的方式。中高端存储支持多个控制器,以保障高可用并提高性能。多控制器为紧耦合,通过PCIE总线或Infiniband网络互连,共享磁盘阵列,共享缓存。

传统存储的系统架构具有I/O路径短,访问延迟小的优势。传统存储通过内置BBU电池或外置的UPS来实现掉电保护,保障缓存中的数据在掉电后不丢失,结合双活、容灾、CDP等技术保障业务系统的连续性和数据安全性。

传统集中式存储起步早,技术成熟,架构简单,表现出足够的稳定性,对高IOPS、低延时、和数据强一致性有很好支持。另外,近年来全闪存阵列存储发展迅速,IOPS性能提高到机械硬盘存储的100倍以上,能够有效解决IOPS性能痛点。

传统集中式存储的特性适合作为金融/医疗等核心业务系统的数据库存储。

传统存储的系统架构决定了其扩展能力有限,无法很好支撑高并发访问性能。随着我们进入大数据时代,集中式存储增长空间越来越有限。

分布式存储

企业不断快速增长的海量数据,需要更有弹性可扩展的存储架构。

分布式存储是新兴的存储技术,采用“标准的x86服务器硬件+存储软件”的架构,将标准X86/ARM服务器通过高速以太网或Infiniband互连,通过分布式存储软件将服务器本地的HDD、SSD等存储介质组织成统一的大规模存储资源池。分布式存储实现了存储的硬件与软件解耦,数据中心能够以标准化硬件搭建存储平台,提升IT敏捷性,降低运维成本,符合软件定义数据中心的发展趋势。

分布式存储也称为软件定义分布式存储(SDS: Software Defined Storage)。

分布式存储的存储单元为x86/ARM服务器(也称为节点),以标准2U 存储服务器为例,前面板可插入12块3.5寸硬盘。

图 存储服务器:2U高度,12盘位

硬盘的容量,有4TB\6TB\8TB\10TB\12TB\16TB等。

如果选择10TB硬盘,则单个节点的物理容量为 12 * 10 = 120TB。

分布式存储有效解决了传统集中式存储的可扩展性问题,规模可扩展至上千个节点,容量扩展到上百PB甚至EB级,性能随容量线性提升。按需在线扩容后,自动实现数据再均衡。分布式存储的多个存储节点能够同时提供读写服务,因此具有很高的吞吐率,可达到几十GB/s。

分布式存储支持3种存储功能,能够打造统一的数据存储平台:

SAN块存储,SCSI/iSCSI接口协议

NAS文件存储,CIFS/NFS接口协议

对象存储,S3接口协议

分布式存储使用多副本和纠删码技术实现数据保护。多副本方式(业界常用的多副本方式一般为2副本或3副本),其优点是可靠性高,性能高;但缺点是存储容量有效利用率低(2副本为50%,3副本为33%)。业界常用的纠删码配置方式一般为8+4(8个数据块,4个校验块,容量利用率为66%)。纠删码的优点是可靠性高,容量利用率高,缺点是性能低。

一般选择原则是:

在线存储设备用多副本;备份归档用纠删码;

小文件用多副本;大文件用纠删码。

目前,国内有多种分布式存储产品可以选择,包括开源软件、基于开源软件优化的产品、国产研发的分布式存储产品等。

上海霄云研发的碧海分布式存储,性能优异,解决了海量小文件存储的痛点,性能达到传统集中式高端存储和Ceph类产品的3倍,文件数可达到百亿级以上,为医疗PACS影像、金融电子票据、自动驾驶工业自动化等海量数据场景提供了革新的存储解决方案。

结语

综上所述,分布式存储是一种未来主流的存储技术,具备非常好的发展前景,但是分布式存储并不能适应所有的业务场景,需要根据实际的业务需求进行合理选择。

审核编辑:符乾江

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储技术
    +关注

    关注

    6

    文章

    747

    浏览量

    45986
  • 存储架构
    +关注

    关注

    0

    文章

    17

    浏览量

    10135
收藏 人收藏

    评论

    相关推荐

    分布式存储集中式存储有何区别

    存储产品千千万,来选去怎么办? 戴小编来献妙策,匹配需求不为难!分布式存储集中式储是存储系统
    的头像 发表于 02-28 10:56 363次阅读

    分布式存储有哪几种类型?

    分布式存储有哪几种类型?分布式存储系统是一种将数据分散存储在多台独立节点上的技术,根据数据模型可分为键值
    的头像 发表于 02-20 11:00 155次阅读

    满足广西地区的配网自动化分布式DTU集中式DTU

    广西配网自动化以实现配网自愈为应用导向,14个市地区大力推进配网自动化分布式DTU和集中式DTU有效覆盖建设,推动解决配网故障影响范围广、故障查找时间长等突出问题,通过自动控制手段快速消除故障、恢复供电,使配网具有感知、诊断、决策、恢复故障的自愈能力。
    的头像 发表于 01-20 16:28 437次阅读
    满足广西地区的配网自动化<b class='flag-5'>分布式</b>DTU<b class='flag-5'>集中式</b>DTU

    安科瑞分布式光伏集中监控系统

    ”目标意味 着国家产业结构的调整,未来10年,新能源装机将保持在110GW以上的年增速,这里面包含集中式光伏电站和分布式光伏电站。相较于集中式电站来说,分布式对土地等自然资源没有依赖,
    的头像 发表于 11-12 15:23 376次阅读
    安科瑞<b class='flag-5'>分布式</b>光伏<b class='flag-5'>集中</b>监控系统

    安科瑞分布式光伏电站智能监控运维系统

    ”目标意味着国家产业结构的调整,未来10年,新能源装机将保持在110GW以上的年增速,这里面包含集中式光伏电站和分布式光伏电站。相较于集中式电站来说,分布式对土地等自然资源没有依赖,各
    的头像 发表于 10-29 18:24 288次阅读
    安科瑞<b class='flag-5'>分布式</b>光伏电站智能监控运维系统

    分布式输电线路故障定位中的分布式是指什么

    所谓分布式指的是产品的部署方式,是相对于集中式而言的。 一、部署方式 分散安装:分布式输电线路故障定位系统中的采集装置需要安装在输电线路的多个位置,通常是每隔一定距离设置一个监测点,以确保对整条线路
    的头像 发表于 10-16 11:39 406次阅读
    <b class='flag-5'>分布式</b>输电线路故障定位中的<b class='flag-5'>分布式</b>是指什么

    瑞萨电子推出三合一电动汽车单元解决方案

    如今,电动汽车驱动器正在从传统的分布式系统过渡到集中式架构
    的头像 发表于 10-11 11:38 471次阅读

    分布式存储费用高吗?大概需要多少钱

    分布式存储的费用是否高,取决于多个因素,包括存储容量、性能要求、服务提供商、计费模式等。因此,无法简单地给出一个“高”或“不高”的答案。通常分布式
    的头像 发表于 09-24 10:41 389次阅读

    4.03MW分布式光伏监控系统并网需要哪些功能

    1.光伏发电主要包括集中式光伏发电和分布式光伏发电两类。集中式光伏发电一般为大型地面光伏电站;分布式光伏发电主要指小型分散光伏电站,其应用
    的头像 发表于 09-10 13:52 434次阅读
    4.03MW<b class='flag-5'>分布式</b>光伏监控系统并网需要哪些功能

    集中式分布式一体化架构,达梦给企业更好的选择

    之路。 数据库选择集中式还是分布式是一个长盛不衰的话题,一些客户可能也会纠结该怎么。在第15届中国数据库技术大会(DTCC2024)上,达梦数据产品服务中心总经理黄海明带来《达梦集中式
    的头像 发表于 09-04 16:39 459次阅读

    同有科技新一代端到端自主可控全闪集中式存储盛大发布

    同有科技坚持“技术立足”、“研发驱动”,自2010年布局自主可控存储研发,集中式分布式两大产品线分别经过五代与三代的迭代开发与市场验证。
    的头像 发表于 07-02 11:35 387次阅读
    同有科技新一代端到端自主可控全闪<b class='flag-5'>集中式</b><b class='flag-5'>存储</b>盛大发布

    华为分布式存储连续三年荣膺2024年Gartner“客户之

    近日,全球权威咨询与分析机构Gartner发布《2024年Gartner Peer InsightsTM 分布式文件系统与对象存储“客户之声”》报告,华为凭借其OceanStor分布式存储
    的头像 发表于 05-24 10:12 836次阅读

    集中式抄表是什么?什么叫集中式抄表?

    1.集中式抄表:简述集中式抄表是一种现代化、高效率的电力工程、水力发电或燃气计量方法,它改变了传统的人工抄表方式,完成了远程自动化数据收集。这类系统主要由中央服务器、通信系统及安装在用户端智能化表计
    的头像 发表于 05-07 14:29 458次阅读
    <b class='flag-5'>集中式</b>抄表是什么?什么叫<b class='flag-5'>集中式</b>抄表?

    分布式储能和集中式储能的区别

    分布式储能和集中式储能是电力系统中两种不同的储能应用模式,它们各自有着独特的优势和应用场景。
    的头像 发表于 04-29 17:36 3922次阅读

    组串逆变器和集中式逆变器区别 组串逆变器的优势

    组串逆变器和集中式逆变器在大型光伏系统中都有各自的应用优势,具体选择取决于系统的具体需求和环境条件。
    的头像 发表于 04-16 16:01 1.1w次阅读
    组串<b class='flag-5'>式</b>逆变器和<b class='flag-5'>集中式</b>逆变器区别 组串<b class='flag-5'>式</b>逆变器的优势