0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

未来不足1.5%的数据被存储!IPFS存储架构应用正在爆发

话说科技 2021-04-19 17:10 次阅读

文/李晋

西部数据公司副总裁兼中国区业务总经理刘钢

“预计到2024年,以HDD为代表的大数据将增长到1.62ZB,均年复合增长率约为30%;以SSD为衡量标志的快数据将达到333EB,均年复合增长率接50%。但与当年143ZB的数据总量相比,仅有不到1.5%的数据被存储下来。”

日的“2021深圳国际大数据与存储峰会暨展览会”上,西部数据公司副总裁兼中国区业务总经理刘钢指出存储领域正面临的困境。在他看来,当前的存储架构和技术并未跟上数据的爆发,而通过创新的存储架构可极大地缓解这种局面。

峰会现场西部数据展台

大数据存储困境:存储架构和技术未跟上数据发展

“数据产生的速度过快”与“被存储的数据十分有限”之间的矛盾,依旧是存储产业需要正视的问题。刘钢援引了两组数据介绍说,预计到2024年,以HDD为代表的大数据将增长到1.62ZB,均年复合增长率约为30%。除了把数据存储下来之外,还有一部分是以SSD作为衡量标志,并对数据进行挖掘、计算的快数据。2024年,快数据将达到333EB,均年复合增长率接50%。大数据与快数据的总量相加约2ZB,而当年的数据总量将达到142ZB,这意味着仅有不到1.5%的数据会被存储下来。

“在数字经济时代,数据犹如石油,是发展的源动力。为什么那么多宝贵的‘石油’或资源没有被存储、挖掘和分析?一个重要的原因是,存储架构和存储技术没有及时地跟上数据的发展,以至于很多数据被白白的浪费。因此,我们需要一个创新的存储架构,为更多的数据提供存储及快速访问。存储行业正面临几个挑战——用户渴求大容量、快速访问、低成本、低功耗的存储,但很难有单一存储介质、存储设备能同时满足些需求。”刘钢感慨说。

值得庆幸的是,由于用户数据要进行分层,且这些数据有不同的类型,它对存储的要求也不一致。企业可以通过把创新的存储架构作为系统,来满足用户各种存储场景的需求。

IPFS存储架构有什么优势?

“创新的存储架构,包含分布式存储架构。”刘钢解释说,存储架构既有中心化的云存储,也有去中心化的分布式存储。例如,基于Web3.0、IPFS(Inter Planetary File System,星际文件系统)存储架构的存储就是去中心化的分布式存储,这类存储可凭借新的存储架构来降低部署及运营成本。

在应用方面,去中心化的IPFS可降低目前基于中心化的云存储的成本。在云存储的服务费用的成本构成有什么特点?其实,最初云存储领域有一个分布式去中心化存储架构叫做Storj,用户可在网上购买相应的服务。而IPFS存储架构的出现,进一步优化了云存储的去中心化,节省了企业的服务提供成本。

·分层存储的概念

除了IPFS存储架构之外,西部数据根据数据被访问的频率,大致分为了五类:极热数据、热数据、温数据、冷数据和极冷数据。针对不同的数据,所要采用的存储介质和存储设备也不同,这样才能既保证海量大数据的存储,也满足对快数据的快速访问。由于不同数据对时延和容量的要求也不同,西部数据还为不同的数据划分了相应的应用场景。从访问频次的高到低,对应的存储类型可分为:极热存储、热存储、温存储、冷存储和极冷存储。

在这些分层的存储应用场景中,主要有大数据存储应用和快数据计算应用两大类。根据刘钢的介绍,大数据存储主要包括极冷存储和冷存储,快数据计算主要涉及极热存储、热存储和温存储。西部数据在这两类存储应用中均有完整的产品及方案。

·西部数据18T硬盘在大数据存储中的优势

业内针对冷存储和极冷存储的主流方案,是高密度大容量企业级硬盘方案。目前,高密度企业级硬盘已经发展到了18T,甚至有的公司针对极冷存储,利用软件与技术优化,采用了SMR叠瓦式硬盘,把高密度企业硬盘做到了20T。比如,全球领先的云存储服务商Dropbox,该公司在去年年底就已经迁移到20T SMR HDD上了。

提到SMR,可能会有一些消费者会质疑它的写入能、可靠。对此,刘钢在后续的媒体群访中解释说:“16T的硬盘通过改进技术变成18T,如果采用的是SMR技术,这个硬盘的容量就会变成20T。它是通过提高磁轨间的密度来做到的,不过这要求用户在使用20T SMR高密度硬盘时在软件上做一些调整,保证顺序地写入。一些公司并未留意到这个细节,没有往这个方向来做调整和优化,致使一些消费者对SMR技术有质疑。“

按照刘钢的说法,SMR适用于冷存储和极冷存储。它最早的应用场景是视频监控,另外还能存储网店的数据、金融的票据、括医疗的数据,以上的数据都可能是极冷数据。现在已经有很多云服务商在积极部署SMR。

刘钢现场展示了西部数据企业级硬盘

在过去几个季度18T硬盘的良率有了较大的改善,无论是互联网服务商,还是IPFS服务商,部署18T已是大势所趋。刘钢在现场展示了西部数据的18T硬盘,他介绍说:“从去年第四季度开始被快速部署,到2021年Q1头部互联网服务商快速验证、测试。2021年Q2开始,很多IPFS公司和云服务商已经考虑把数据迁移到18T高密度硬盘上,甚至有些高密度极致需求的用户还觉得18T硬盘不够用。今年下半年,我们将提供20T硬盘,已经有企业在测试、验证中,预计从明年开始进行部署。”

值得强调的是,头部云服务商所使用的硬盘从8T进化到18T,花费了整整四年时间(2017-2021年),而IPFS服务商仅用了四个季度(2020年Q2-2021年Q2)。IPFS服务商从8T进化到12T、14T、16T,很快就过渡到18T。实际上,当数据中心采用的硬盘从14T升级到18T,在同样存储容量的情况下,服务器的数量可减少22%,单盘容量增加29%,单位功耗降低21%,其部署成本、运维成本也更低。

·西部数据SSD产品在快数据领域的优势

西部数据针对快数据如热存储、温存储,有推出过两款基于96层3D NAND的SSD,其中一款是主流的Ultrastar™ DC SN640 NVMe SSD,适用于读写均衡混合型工作负载应用;另一款是写密集、计算密集的高能Ultrastar™ DC SN840 NVMe SSD,适用于密集型工作负载应用。此外,西部数据还联合铠侠在今年2月推出了162层的第六代3D闪存技术。

据刘钢介绍,西部数据与铠侠提供了全球33%的Flash产能。这两家公司联合推出的第6代3D闪存技术,比第五代产品的芯片尺寸缩小了40%,侧面单元密度更高,程序能提高了两倍以上,读取延迟缩短了10%,输入/输出IOPS提高了66%。

“从材料本身来看,3DNAND的堆叠层数越高风险就越大,对工艺和投入的要求越高。在3D NAND 96层之后,很多公司后续产品的层数并不一致。“刘钢特别强调说,在同一代技术里,一家公司的3D NAND层数越少,就代表它的技术越先进,因为无需堆叠太多层,即能满足闪存的能需求。西部数据在96层之后是112层,而不是120多层,再然后是162层,而不是170或190多层,说明西部数据在单位面积上能做到更高的密度。

除了增加层数之外,存储密度还有另一种增长方式:闪存颗粒从TLC变成QLC,甚至变成PLC。实际上,存储增长密度的方式并不是一维的,它既可纵向增长也可在一个单元内部增长。“西部数据企业级SSD具备纵向集成优势。我们有先进的SSD控制器和高能自主固件将Flash纵向集成,最终能实现非常稳定的一致。以某大型电商的应用为例,他们要求SSD的波动范围不超过10%,用UltrastarTM DC SN640 NVMe SSD测出来波动数据是0.11%。”刘钢表示,对SSD产品而言,具备稳定的一致极其关键,因为它涉及到非常多的因素。

可靠与生产工艺和硬盘的设计、控制有关。首先,闪存与工艺周期有关系,如果没有大规模的产能,就很难度过产能周期。另外,当SSD容量越大,其大部分成本会在闪存上,控制器、接口成本占的比例会越来越小,所以产能非常重要;其次,是领先的技术。企业需要追求整个硬盘的能,而不是仅仅关注闪存材料的能、可靠。基于整体的可靠,控制器和固件可以进行很好的开发。以上因素就是一家公司能够做到的纵向整合,只有做到极致地优化,才能提供超级稳定的一致。“只有既熟悉材料,也熟悉控制器,还熟悉框架,才能做到纵向一体的集成。“刘钢强调。

总之,西部数据能满足用户的不同存储、计算需求,可提供适用于不同层级数据的存储产品。无论是大数据存储,还是快数据计算,都有相应的产品。如果把这样的存储架构和存储技术,使用到IPFS或Web3.0场景里,会是什么样的应用?

IPFS服务商与西部数据的产品组合

对IPFS服务商而言,现在的存储方案存在着数据吞吐量低,空间利用率低、难扩容,总体拥有成本高,运维低效,故障惩罚高等痛点。在IPFS层面“存算分离”已经是共识,在计算集群中,西部数据有7.68TB的SSD;在存储集群中,西部数据推荐使用18TB的高密度硬盘,4U60+18T存储方案与传统的4U36+16T存储方案相比,机柜数可减少46%、功耗可减少36%,可大规模降低部署及运维成本。

西部数据已经与合作伙伴共同推出了各种IPFS方案。典型的应用案例有:

星辰天合(XSKY)、浪潮联合西部数据推出了IPFS解决方案,该方案基于西部数据的Ultrastar DC HC550 18TB HDD硬盘、浪潮英信服务器NF5466M5、XSKY的文件存储系统等关键组件,可实现快速部署、便捷运维。与4U36服务器+14TB HDD方案相比,4U36+18TB HDD方案能节省22%的机柜空间,节约两倍以上的硬件资源,降低20%的电源功耗。

杉岩数据的MOS海量对象存储系统采用了西部数据的Ultrastar DC SN840/640 NVMe SSD、Ultrastar DC HC550 HDD和JBOD存储台。与主流的4U36+16T方案相比,双方合作的4U60+18T方案可将服务器节点数量降低至原来的47%,节省了46%的机柜空间,降低了36%的电源功耗。

长城超云不仅在存储集群里使用了西部数据的产品,还在计算集群里使用了Ultrastar DC SN640 NVMe SSD,以此来提高封装的效率,获得更高的能和稳定的运行。此外,IPFS分布式存储服务器制造商灵动也在计算机群和存储机群里采用了适用于快数据的7.68T SSD存储方案和适用于大数据的18T高密度硬盘存储方案。

总而言之,西部数据针对Web3.0或IPFS的基础设施架构:在存储集群中,有高密度的磁盘扩展柜、大容量的18T硬盘,还有UltrastarTM DC SN640 NVMe SSD来作为缓存。在计算集群中,有UltrastarTM DC SN640 NVMe SSD、UltrastarTM DC SN840 NVMe SSD写密集型的SSD产品助力用户做快速运算。

尤其是在计算集群中,西部数据解决了P1和P2的能瓶颈。刘钢表示,P1是可以并行的,P2之后是串行的。IPFS服务商更愿意把P1和P2分开,但因为P1和P2节点之间需要交换大量数据,分开之后虽然可以提高计算能,但是会造成数据传输花费很多时间,这样其实是不划算的。如果所有的服务器集群共享一个高速闪存池,两类服务器通过NVMe-oF连到高速的闪存池,P1计算的数据在闪存池里,P2可以直接放入,它们可以像访问本地闪存一样,访问高速的资源共享池。对大规模的IPFS分布式存储服务器制造商来说,当他们的节点达到100个PB以上时,可能需要用这些存储技术来优化存储技术架构。

刘钢在最后也强调了西部数据引以为傲的优势,也就是拥有全线的多场景的存储技术和产品,可提供从芯片到系统的存储技术和产品,适用的场景从消费者级的手机、相机到个人电脑自动驾驶汽车,到企业级和云端的计算和存储节点。在未来数据爆炸式增长的环境中,这样的优势将为包含企业客户的数据存储架构、行业的存储和一般用户的个人存储提供领先的优势。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏

    评论

    相关推荐

    数据存储专委会成立,先进存力如何背负起数智化的未来

    数据存储
    脑极体
    发布于 :2024年11月09日 11:17:37

    如何优化emc存储性能

    在当今的数据中心环境中,存储性能对于业务连续性和数据访问速度至关重要。EMC作为领先的存储解决方案提供商,其产品线涵盖了从入门级到企业级的存储
    的头像 发表于 11-01 15:57 269次阅读

    emc软件定义存储未来发展

    随着数字化转型的加速,数据存储需求日益增长。EMC(易安信)作为全球领先的数据存储解决方案提供商,其软件定义存储(SDS)技术在满足企业
    的头像 发表于 11-01 15:28 358次阅读

    存储器主要用来存储什么

    存储器(内部存储器)是计算机硬件的重要组成部分,它直接与中央处理器(CPU)相连,用于存储正在运行的程序和当前处理的数据。内
    的头像 发表于 10-14 09:55 609次阅读

    随机存储器的特点和结构

    随机存储器最显著的特点是其易失性,即当电源关闭时,存储在RAM中的数据会立即丢失。这是因为RAM依赖于电流来维持其存储数据状态。当电源
    的头像 发表于 09-26 18:18 813次阅读

    数据中心提高存储性能的方法是什么?

    这些技术是走向云计算的重要的第一步。 重复数据删除 在任何数据存储系统最大的阻碍是相关的冗余数据。采用智能压缩技术,可以删除重复数据,只保留
    的头像 发表于 08-05 11:40 399次阅读

    闪存的哪些扇区可用于用户数据存储

    我想问一下闪存的哪些扇区可用于用户数据存储(例如配置、登录名/密码)。目前,我正在使用外部存储器,但使用板载闪存的某些扇区会更便宜。我尝试在用 blank.bin 编写的一些扇区中写入
    发表于 07-12 08:13

    ESP32S2F使用内部存储并开启PSRAM后提示内存不足是哪里的问题?

    我测试使用的是ESP32S2F, 4M flash 2M PSRAM,在使用中挂接显示屏运行的LVGL,然后使用串口接收数据并显示,运行正常;后打开了wifi,但是打开后开始提示内存不足,在
    发表于 07-01 06:49

    态势数据如何存储

    智慧华盛恒辉态势数据存储主要依赖于数据库技术和文件存储系统。以下是一些关于如何存储态势数据的建
    的头像 发表于 04-22 17:29 337次阅读

    Netapp数据恢复—Netapp存储中卷误删除的数据恢复案例

    NetApp存储数据恢复环境: NetApp FAS某型号存储,该NetApp存储中有96块扇区大小是520字节的SAS硬盘。存储中的lu
    的头像 发表于 04-18 15:52 408次阅读
    Netapp<b class='flag-5'>数据</b>恢复—Netapp<b class='flag-5'>存储</b>中卷<b class='flag-5'>被</b>误删除的<b class='flag-5'>数据</b>恢复案例

    存储芯片是什么样存储信息的

    存储信息时,对于动态存储器,行地址首先将RAS锁存于芯片中,然后列地址将CAS锁存于芯片中,当WE有效时,写入数据存储于指定的单元中。
    的头像 发表于 03-29 15:32 3199次阅读
    <b class='flag-5'>存储</b>芯片是什么样<b class='flag-5'>存储</b>信息的

    数据中心存储的趋势

    随着数据存储需求的持续增长,数据中心存储技术和架构不断发展以满足企业和消费者的需求。在本节中,我们将分析数据中心存储
    的头像 发表于 03-18 17:39 538次阅读

    数据存储技术未来发展趋势与前景展望

    数据存储对于数据挖掘与分析、数据整合与共享、智能决策支持、业务模式创新以及优化资源配置等方面具有重要作用。按照存储介质不同,
    发表于 02-27 09:29 3386次阅读
    <b class='flag-5'>数据</b><b class='flag-5'>存储</b>技术<b class='flag-5'>未来</b>发展趋势与前景展望

    Netapp存储数据恢复案例

    某单位一台Netapp存储,该Netapp存储内共有数十块SAS硬盘。 工作人员误操作删除了Netapp存储中12个lun,删除的数据包括客户信息和其他重要
    的头像 发表于 01-04 15:26 437次阅读
    Netapp<b class='flag-5'>存储</b><b class='flag-5'>数据</b>恢复案例

    性能领先|忆联×新华三,打造超融合架构下的高性能存储方案

    为助力企业用户构建超融合架构的现代化数据中心,满足业务发展需求,忆联联合新华三集团在超融合架构下打造高性能存储方案,以此提高数据中心的管理效
    的头像 发表于 12-27 18:21 608次阅读
    性能领先|忆联×新华三,打造超融合<b class='flag-5'>架构</b>下的高性能<b class='flag-5'>存储</b>方案