0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

纠删码技术为产业转型升级构筑数据护盾

浪潮存储 来源:浪潮存储 作者:浪潮存储 2022-06-16 09:20 次阅读

百万猎人兵临城下,向魔法护盾发起猛烈冲击,却无法将拥有99级神力的护盾撼动分毫。

这是科幻电影《头号玩家》里的一幕。电影里,不仅“绿洲”被视为元宇宙未来理想形态,“魔法护盾”也迅速跨界出圈,在企业数据管理领域引发关注。这是因为随着数字经济快速发展,数据要素在受到企业重视的同时,全球超80%的IT决策者认为现有数据保护方案无法满足未来业务挑战,保护好数据资产成为企业的当务之急。

日前,在由存储产业技术创新联盟主办的“元宇宙存储研究与实践”开放计算技术沙龙上,来自中科大、华中大、郑州大学、建信金科以及浪潮存储的“产学研用”各界专家汇聚一堂,在关注元宇宙存储发展的同时,还共同就纠删码优化、细粒度感知等数据保护话题展开讨论。本次沙龙是场景共同体战略的承袭和实践,浪潮信息存储产品线总经理李辉曾提出,面向层出不穷的新应用、新场景,携手产业链伙伴推进“平台+生态”战略,以六种模式加速企业数字转型。

数据保护

悬在头顶的达摩克里斯之剑

数字虚拟人需要收集的高达百倍甚至千倍的数据、VR头显从4K升级到视网膜级需提升10倍数据传输量、飞行模拟器采集的数据量超2PB。

以元宇宙为代表的新应用带来数据规模十倍、百倍激增,快速增长的多模态数据增加了企业数据保护的难度。数据显示,企业现在管理的数据量是五年前的十倍以上,全球82%、中国88%的IT决策者担心现有数据保护方案无法满足未来业务挑战。

这些担忧源自企业的现实困境,根据对全球1000名决策者的调研,全球30%的受访者在过去一年中经历过数据丢失,45%遭遇过计划外的系统停机。另据IDC统计,在过去12个月,全球超过三分之一的组织遭遇过勒索软件攻击或入侵,导致系统或数据无法访问。数据保护,已然成为摆在企业数字化转型面前的一大挑战。本次沙龙,中国科学技术大学许胤龙教授以及浪潮存储技术专家共同给出了答案。

数据容错

业界两种技术流派之争

“数据容错,业界通常有两种办法,一种是多副本,另一种是纠删码”,许胤龙教授表示。多副本访问性能高、故障修复快,但存储开销比较大(烧钱、占地),令企业直呼吃不消;纠删码开销小(花小钱、办大事),一般存储空间比RAID 1镜像小,在数据爆炸式增长的趋势下更受市场欢迎,企业用脚投票纷纷选择了纠删码。

d78f7c4c-ed08-11ec-ba43-dac502259ad0.png

△三副本和纠删码对比

时下人气攀升的纠删码,究竟是什么呢?所谓纠删码(Erasure Coding),是一种数据保护方法,它将数据分割成片段,把冗余数据块扩展、编码,并将其存储在不同位置,比如硬盘、存储节点或其他物理位置。

“纠删码,可以简单理解成对原始数据做线性组合”,许胤龙教授表示。比如 (2+2)纠删码,就是A、B两个数据可以做A+B和A+2B的线性组合,能容任意两个节点错,当恢复数据的时候直接解方程就行。一般情况下,业界常用的是(k,m)-MDS码,把k个数据编码成m个校验数据,k+m个数据块形成一个条带,最多可以容许m个块同时故障。工业界常见的m一般是2或3,数据规模较大的话,可以把m设为4~6。

纠删码

跑得如丝般顺滑并非易事

纠删码“花小钱、办大事”的优势虽然非常明显,但要在超大规模数据中心内或者是跨数据中心使用纠删码做数据保护,却需要过五关闯六将,绝非易事。

第一关

同一数据中心内,数据恢复的网络传输时间占比超90%,纠删码“龟速”难题如何破。

纠删码能够降低存储成本、提高容错能力,但纠删码最大的问题是在数据丢失之后,数据恢复过程需要从其他地方读取大量数据,故障修复堪称龟速。通过对纠删码“从存活节点读取数据、传输、在备份节点解码、传输、在替代节点写入”的整个流程做分析,发现网络传输占整个数据恢复时间的比例超90%,如何优化数据恢复时间呢?

首先,数据分批恢复。在实际系统里面,数据块是随机的分布到不同的节点里,随机数据分布从统计概率的角度来说,是能达到负载均衡的。但一般来说,在系统实现的时候,一般来说因为系统IO、内存、CPU资源也有限,同时系统还要支撑前台的应用综合各方面,所以修复一般都会是分批进行。“我们做过实验,分批比不分批大概要快15%左右”,许教授表示。

d7bcf51e-ed08-11ec-ba43-dac502259ad0.png

△清华、港中大、普渡、中科大纷纷开展纠删码优化研究

其次,可以利用二部图和网络流图的办法,使得从不同的节点上进行恢复的时候,不同节点上读数据量是均衡的,写数据量也是均衡的,并且每一个节点承担的恢复任务也是均衡的。清华、港中大、普渡、中科大等顶级高校均对纠删码技术进行了研究,经过优化中科大SelectiveEC技术能够在90%以上的情况下都实现负载均衡,相比HDFS大约50%的负载均衡水平,中科大的负载均衡水平能高出70%以上,恢复速度提升30%以上。同时Selective EC比HDFS有更少的毛刺、更短的长尾、更短的任务生命周期。

d7f71262-ed08-11ec-ba43-dac502259ad0.png

△纠删码优化结果

“我们很认同许教授的观点,为了实现数据纠删的负载均衡,浪潮存储一直在技术上不断打磨和创新”,浪潮信息分布式存储架构师张立强表示。

浪潮分布式存储AS13000突破软硬件协同宽条带纠删技术,融合多元算力,解决数据高冗余比纠删的计算性能、资源消耗、容量、可靠性等指标难以兼顾的问题。举个例子,浪潮存储创新研制了纠删码FPGA加速卡,设计可重构最小硬件逻辑单元,实现编解码复用、全纠删比支持,实现宽条带纠删的CPU计算卸载。在32+6纠删比配置下,浪潮存储能够将处理器平台的CPU占用率降低90%,性能提升390%,这就如同将汽车行驶的速度提升到了复兴号的水平。其实浪潮分布式存储在高校领域应用广泛,目前已经在中科大、清华、北大、复旦、浙大、中山大学等国内顶级高校实现规模化部署,支撑科研智慧应用平台稳定运行,以数据之力助力科研取得丰硕成果。

第二关

跨数据中心场景,数据中心带宽极其有限,如何“跨越万水千山”做纠删。

考虑到地震、山洪、火灾等灾害因素影响,大型企业往往会跨数据中心做数据保护。所谓跨数据中心,是指多个数据中心可能建在距离城区比较远的地方或者是不同的城区的地方,这时候跨数据中心的带宽就会很宝贵,通常跟数据中心内部的带宽相比,跨数据中心带宽只有1/20。

d820cbfc-ed08-11ec-ba43-dac502259ad0.png

△跨数据中心带宽约为数据中心内带宽的1/20

RS码部署方式在同一数据中心内做纠删是有优势的,但在跨数据中心环境下却面临挑战。这是因为RS码是把一个条带的数据均匀分布到不同数据中心去。假如现在有15个数据块,把它编码成12个校验块,分散在三个数据中心,这时候只能容单个数据中心故障,存储开销大概是180%,如果出现单块故障,需要跨数据中心访问7个数据块,需要的带宽开销比较多。

新型LRC(Locally Repairable Code)分组编码方式,可以在存储开销和恢复性能之间做一个权衡。LRC(k,l,g)分组编码有三个值,k表示数据块,l代表局部校验块,g是全局校验块。LRC分组编码通过读取局部数据块,减少重构所需的数据量,从而提升数据修复性能。这就好比618购物,北京小伙买一箱牛奶,如何用最快的速度把货物送到顾客手里呢,电商平台会找到距离顾客比较近的天津或河北仓库(类似l局部校验块)进行配送,尽量减少从西安或广州(类似g全局校验块)调货的概率。

d8540364-ed08-11ec-ba43-dac502259ad0.png

△LRC分组编码技术优化结果

按照新型部署方式,“在实际集群里面,我们实现了数据传输、数据解码的优化,大概能把速度提升30%”,许胤龙教授表示。

“浪潮一直将可靠性视为存储的生命线,在异地数据保护方面做了诸多创新”,浪潮信息存储研发部何营表示。

浪潮存储不仅基于一套存储架构承载块、文件、对象、大数据等多种数据服务,在WAN加速、快速重构、透明故障切换等高级功能方面持续创新。以WAN广域网加速技术为例,浪潮存储通过数据流压缩、固定块切割和多数据流并发,将远程传输性能提升高达10倍、延时降低10倍,帮助海量数据异地迁徙和灾备。

小结

伴随元宇宙、AI、大数据新技术、新应用不断涌现,数字经济正在成为中国经济发展的关键因素。数据显示,从2020年到2025年数字经济核心产业增加值将从7.9万亿提升至13万亿,是驱动GDP增长的引擎。

“浪潮存储是整体市场全球前四、分布式存储销量中国第一的存储厂商,纠删码技术在浪潮大部分分布式存储客户中得到应用,为产业转型升级构筑了数据护盾”,浪潮信息首席架构师叶毓睿表示。未来浪潮存储将携手产学研用各方力量,共建场景共同体驱动社会高质量发展。

原文标题:元宇宙存储:如何为ZB级数据打造魔法护盾

文章出处:【微信公众号:浪潮存储】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4337

    浏览量

    85994
  • 浪潮
    +关注

    关注

    1

    文章

    465

    浏览量

    23903
  • 纠删码
    +关注

    关注

    0

    文章

    5

    浏览量

    4951

原文标题:元宇宙存储:如何为ZB级数据打造魔法护盾

文章出处:【微信号:inspurstorage,微信公众号:浪潮存储】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基调听云荣膺数字安全护航计划优秀企业,斩获“磐安”双项大奖助力产业升级

    新场景下的网络安全挑战,以数字安全为坚实,助力产业高速发展。中国信通院总工程师魏然、中国信通院泰尔终端实验室主任马鑫及各优秀企业代表汇聚一堂,共同分享数字安全
    的头像 发表于 12-30 11:45 106次阅读
    基调听云荣膺数字安全护航计划优秀企业,斩获“磐安”双项大奖助力<b class='flag-5'>产业</b><b class='flag-5'>升级</b>

    安全升级,智启未来!广东工业安全生产数智化转型闭门分享会圆满举办

    8月26日,由华为技术有限公司(以下简称“华为”)与广州英信息科技有限公司(以下简称“英科技”)联合主办,广东省应急产业协会为支持单位的“广东工业安全生产数智化
    的头像 发表于 08-28 14:54 280次阅读
    安全<b class='flag-5'>升级</b>,智启未来!广东工业安全生产数智化<b class='flag-5'>转型</b>闭门分享会圆满举办

    港迪技术IPO上市:助力基础产业转型升级,新旧产业融合特征明显

    的敏锐洞察力和国家级专精特新“小巨人”企业的担当,积极响应行业需求,以创新技术引领,基础设施行业的绿色转型与智能化升级注入了强劲动力。
    的头像 发表于 08-27 15:48 532次阅读

    传统园区转型升级智慧园区的路径探讨

    随着科技的快速发展和经济结构的转型升级,传统园区面临着转型的迫切需求。智慧园区以其高效、绿色、智能的特点,成为了未来园区发展的方向。古河云科技将从几个关键方面探讨传统园区如何实现向智慧园区的
    的头像 发表于 08-19 11:40 184次阅读
    传统园区<b class='flag-5'>转型</b><b class='flag-5'>升级</b>智慧园区的路径探讨

    聚焦产业转型,以数智创新加速发展云时代企业ERP升级创新实践

    产业转型 创领未来”为主题,汇聚了来自装备制造、化工、零售、建筑与地产行业的超过百位企业精英、行业专家与合作伙伴,共同探讨 AI 时代下,面对市场环境的剧烈变化与挑战,深入交流管理升级、全球化运营、智能化人力组织、
    的头像 发表于 07-29 16:07 711次阅读
    聚焦<b class='flag-5'>产业</b><b class='flag-5'>转型</b>,以数智创新加速发展云时代企业ERP<b class='flag-5'>升级</b>创新实践

    时代中标深圳市重大产业投资集团有限公司

    时代中标深圳市重大产业投资集团有限公司(简称“深重投集团”),运用统一终端安全,零信任网络访问和智能决策大脑等技术,结合芯时代丰富的身份安全项目经验,帮助企业构建智能、动态、高效
    的头像 发表于 07-23 09:25 447次阅读

    灵半导体入选2024年度福建省数字经济核心产业创新企业

    。瞪羚企业是以新技术、新业态、新模式支撑稳步进入高成长期,综合效益突出、行业影响力大、社会诚信度高、示范带动性强,在引领中小企业转型升级和促进民营经济发展中作用明
    的头像 发表于 06-18 08:23 590次阅读
    <b class='flag-5'>码</b>灵半导体入选2024年度福建省数字经济核心<b class='flag-5'>产业</b>创新企业

    三坐标检测设备助力产业升级转型

    蔡司三坐标检测设备致力于推动制造业从传统加工车间向智能工厂的升级转型。企业借助在线或离线质量检测系统,客户的产品加工质量提供保障,实时关注生产线的产品加工质量。工艺改进后,产品质量的变化一目了然
    的头像 发表于 05-31 14:12 261次阅读
    三坐标检测设备助力<b class='flag-5'>产业</b><b class='flag-5'>升级</b><b class='flag-5'>转型</b>

    时代中标金龙鱼,助力食品制造行业升级数字安全防线

    时代中标金龙鱼,助力食品制造行业升级数字安全防线
    的头像 发表于 05-21 14:05 357次阅读
    芯<b class='flag-5'>盾</b>时代中标金龙鱼,助力食品制造行业<b class='flag-5'>升级</b>数字安全防线

    会员风采!华秋电子——致力于“电子产业增效降本”的数字化智造平台

    上市。 搭载产业互联网东风,华秋电子进入数字化电子供应链快车道 随着物联网、人工智能、5G大时代的到来,产业互联网大势所趋,”互联网+智能制造“是当前电子产业转型
    发表于 05-13 09:53

    华为智能AntiDDoS解决方案数据中心构筑坚实防护之

    Grohnfeldt发表了“华为Anti-DDoS解决方案,数据中心业务的防护之”议题演讲,吸引了来自全球诸多行业客户及网络安全专家的驻足聆听。
    的头像 发表于 04-25 09:23 487次阅读

    中国第三代自主超导量子计算机“本源悟空”成功装备抗量子攻击

    据安徽省量子计算工程研究中心透露,“本源悟空”已成功配备国内首个“抗量子攻击”——PQC(后量子密码)混合加密系统,从而提升其防御能力,保障运行数据安全。
    的头像 发表于 04-12 14:28 600次阅读

    华为云尚海峰:以数智技术核心,加速培育和形成新质生产力

    科技创新与产业创新深度融合,记者采访了华为混合云总裁、主机上云军团CEO 尚海峰,他分享了如何通过数智技术帮助政企加快发展新质生产力,实现产业转型和智能化
    的头像 发表于 04-10 23:19 558次阅读
    华为云尚海峰:以数智<b class='flag-5'>技术</b><b class='flag-5'>为</b>核心,加速培育和形成新质生产力

    IPv6--促进信息基础设施升级构筑产业数字化发展坚实底座

    当前,中国正处于产业数字化转型关键期,产业数字化需要更高速、更可靠、更精准的先进网络作为支撑。传统互联网的资源和安全瓶颈正在制约技术创新和产业
    的头像 发表于 04-03 13:19 467次阅读
    IPv6--促进信息基础设施<b class='flag-5'>升级</b>,<b class='flag-5'>构筑</b><b class='flag-5'>产业</b>数字化发展坚实底座

    首个鸿蒙生态创新中心在深揭幕,开启鸿蒙产业新篇章共绘鸿蒙原生应用开发新篇章

    ,通过构建鸿蒙生态服务体系,开拓鸿蒙系统应用场景和市场空间,同时作为鸿蒙生态创新中心的建设和运营单位,鸿蒙生态伙伴提供政策宣贯、奖补辅导、商机对接、技术支持、品牌推广、人才培养、测试认证等服务,协助生态伙伴转型
    发表于 03-20 09:55