0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息分布式存储在人工智能领域的应用

浪潮存储 来源:浪潮存储 2024-11-26 13:44 次阅读

随着AI技术机器学习演进至深度学习,并进一步迈向生成式AI的新阶段,算法、算力及数据需求呈现出爆炸式增长态势。大模型爆发初期,众多企业布局,要求存储提供高带宽、高IOPS和低时延,以确保模型能够快速有效地进行训练。而在模型的实际部署与应用过程中,又需要实现数据的跨域、跨介质灵活调度,以及高质量数据集的高效管理,这对存储系统的灵活性、安全性及数据的可持续访问能力构成了新的挑战。

在近期举办的中国数据与存储峰会AI+存储协同发展论坛上,分布式存储产品总监张业兴发表了题为“数聚存储,智慧未来”的演讲。演讲中,张业兴不仅回顾了过去一年人工智能领域的迅猛发展态势,还深入阐述了浪潮信息在这一背景下如何精心布局新产品、新技术和新方案。

AI时代:存储的转型与重塑

人工智能已被提升至国家战略的高度,成为驱动新质生产力发展的关键力量。张业兴指出,数据作为一种新型生产要素,不仅是劳动工具,还能创造经济价值。随着数据的迅猛增长和摩尔定律的持续推动,人工智能正步入一个爆发式增长的阶段,特别是在GPU市场规模及智能算力领域,展现出了惊人的增长潜力。据预测,至2028年,全球GPU市场规模有望达到2461.5亿美元,而中国市场的规模也将攀升至459亿美元,年复合增长率高达32.8%。这一趋势清晰地表明,人工智能正引领着第四次工业革命,对经济社会产生着广泛而深远的影响。

在人工智能时代的大背景下,存储系统的角色已悄然转变,它不再是单纯的数据存储容器,而是成为了推动人工智能发展的核心组件。随着大模型技术的蓬勃发展,存储系统正面临着前所未有的挑战。在大模型市场的初期布局中,已有超过400家厂商争相涌入,模型训练的“速度”成为了竞争的关键。为了提高GPU的利用效率,存储系统必须能够提供TB级的高带宽和百万级的高IOPS,以确保模型训练的高效运行。

此外,随着模型在各行业的落地,数据的跨域和跨介质调动变得至关重要,存储系统需要实现全局命名空间的管理,以支持大规模数据的高效汇集和利用。同时,在大模型的行业化落地过程中,为了提升通用模型的专业化能力,高质量且可重复利用的数据集成为了不可或缺的资源。数据的安全存储与可持续性访问能力成为了存储系统必须满足的重要要求。

AS13000G7:解锁存储潜能,赋能AI未来

针对上述挑战,浪潮信息推出了分布式融合存储平台AS13000G7,在性能优化、融合互通、韧性保障等多个维度进行了技术创新。

在性能优化方面,AS13000G7通过数控分离架构,减少了数据在转发和拷贝过程中的延迟,单流带宽可达15GB/s,单节点带宽超过100GB/s,相比传统数控一体架构性能提升60%以上。此外,AS13000G7能够智能识别大IO和小IO,通过切片处理和聚合处理,将不同规模的数据形成统一的数据团,并存入全局缓存中,实现小IO性能提升5倍。同时,数据缓存预读功能能够在训练过程中提前加载热点数据,进一步提升数据加载速度。另外,AS13000G7还设计了全用户态的轻量级IO站,利用多任务并行和无锁IO处理技术,实现了延迟降低40%,训练数据加载时间减少30%。

在近期发布的MLPerf Storage v1.0 AI存储基准测试中,AS13000G7参与了八项测试并获得了五项全球第一的成绩,如3D-UNet测试中,支持264个模拟加速器,GPU利用率超90%时提供360GB每秒带宽,单节点带宽超120GB每秒;在CosmoFlow模型测试中,样本读取时间极短,单客户端和多客户端分别提供了18GB/s和52GB/s的带宽。

在融合互通方面,AS13000G7支持多种接入协议,如NFS和S3等,并通过复原数据管理实现文件和对象数据的协议互通、语义无损以及性能一致,避免了数据格式转换和多份存储的问题,为用户节省了高达50%的存储空间。同时,AS13000G7还建立了全局统一命名空间,纳管所有数据,实现跨域、跨介质和跨协议的灵活调动,提供统一数据视图,并支持10亿级文件秒级检索,有效解决了数据孤岛问题,方便用户数据访问与管理。

在韧性保障方面,AS13000G7定期进行亚健康检测,并通过内部冗余保护机制实现免迁移快速重构,将TB级重构时间降至5分钟内,每次故障恢复时间降低90%。此外,AS13000G7运用AIOps算法预测磁盘故障、容量趋势、性能趋势和SSD寿命,其中磁盘故障预测准确率达98%以上,误报率仅0.007%。在数据安全层面,AS13000G7设置了五层系统防护,采用快筛机器学习和深筛深度学习算法来检测恶意软件,漏报率仅为0.029%,误报率为0.33%。

面向大模型应用,基于AS13000G7的AI存储解决方案,整合不同盘位存储设备形成统一资源池,提供高性能、高利用率和高韧性,满足数据全生命周期需求。结合AI资源调度平台,提升数据预读加载效率30%,已服务众多AIGC客户。

在上海某高校的应用案例中,由于该校拥有多个与AI相关的学科,数据导入呈现出多元多态的特点,业务需求也涵盖了数据的汇集、处理、训练和推理等多个环节。浪潮信息为其提供32节点GPU服务器作为计算支持,并配置20个节点的AS13000G7 24盘位全闪节点作为存储资源池,实现对象文件融合存储,降低总体拥有成本(TCO)达30%,大带宽高IOPS的特性支持了模型毫秒级读写,进一步缩短训练等待时间40%。

AS13000G7分布式融合存储平台以其高性能、高效率和高韧性,成为支持人工智能发展的理想选择。在人工智能蓬勃发展的时代,浪潮信息将凭借其卓越的产品和解决方案,积极应对挑战,抓住机遇,为构建智慧未来奠定了坚实的数据存储基础,成为行业发展的重要引领者。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 浪潮
    +关注

    关注

    1

    文章

    461

    浏览量

    23878
  • AI
    AI
    +关注

    关注

    87

    文章

    30979

    浏览量

    269246
  • 人工智能
    +关注

    关注

    1791

    文章

    47336

    浏览量

    238694
  • 分布式存储
    +关注

    关注

    4

    文章

    171

    浏览量

    19532

原文标题:数聚存储,智慧未来:分布式存储在人工智能时代的创新与应用

文章出处:【微信号:inspurstorage,微信公众号:浪潮存储】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    浪潮信息剖析智能时代数据存储领域面临的挑战与机遇

    在当今数字化时代,算力与存力的协同增长已成为驱动各行各业发展的关键力量。特别是人工智能(AI)这一前沿领域,随着数据量的爆炸增长,对存储
    的头像 发表于 12-30 09:43 133次阅读

    浪潮信息AI存储性能测试的领先之道

    AI技术的无限可能。近日,MLCommons的子项目MLPerf Storage v1.0性能基准评测中,浪潮信息再度展现了AI存储领域
    的头像 发表于 10-29 16:30 255次阅读
    <b class='flag-5'>浪潮信息</b>AI<b class='flag-5'>存储</b>性能测试的领先之道

    33家元脑区域伙伴与浪潮信息签署战略合作协议

    近日,2024年浪潮信息区域ISP伙伴战略签约仪式圆满落幕,标志着浪潮信息人工智能领域的合作版图再度扩大。此次盛会汇聚了全国范围内33家实
    的头像 发表于 08-14 16:25 463次阅读

    浪潮信息引领数据编排新纪元,加速释放数据潜能

    2024年数据基础设施技术峰会的璀璨舞台上,浪潮信息分布式存储产品线架构师Lance Sun博士以其深厚的行业洞察与前瞻视角,发表了题为“高效数据编排,加速释放数据潜能”的精彩演讲,
    的头像 发表于 07-03 15:30 394次阅读

    浪潮信息推出AIGC存储解决方案

    近日,科技创新的浪潮中,浪潮信息成功举办了“元脑中国行”全国巡展的杭州站活动,此次盛会不仅汇聚了业界的精英与目光,更见证了浪潮信息AIG
    的头像 发表于 07-03 11:16 731次阅读

    浪潮信息推出基于新一代分布式存储平台AS13000G7的AIGC存储解决方案

    6月28日,浪潮信息“元脑中国行”全国巡展杭州站顺利举行。会上,浪潮信息重磅推出基于新一代分布式存储平台AS13000G7的AIGC存储解决
    的头像 发表于 07-01 19:00 1441次阅读
    <b class='flag-5'>浪潮信息</b>推出基于新一代<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>平台AS13000G7的AIGC<b class='flag-5'>存储</b>解决方案

    浪潮信息分布式存储AS13000完成英特尔至强6能效核处理器适配

    近日,浪潮信息分布式存储AS13000完成英特尔至强6能效核处理器适配,实现每瓦性能提升2.3倍,以更高的效率、更优的成本满足海量多态数据的存储需求,充分释放数据价值。
    的头像 发表于 06-19 10:05 872次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>分布式</b><b class='flag-5'>存储</b>AS13000完成英特尔至强6能效核处理器适配

    浪潮信息发布AS13000G7-N系列分布式全闪存储

    浪潮信息近日推出了专为大型AI模型优化的AS13000G7-N系列分布式全闪存储。该系列基于浪潮信息自研的分布式文件系统,结合新一代数据加速
    的头像 发表于 05-14 10:03 572次阅读

    为大模型专门优化 浪潮信息发布分布式全闪存储AS13000G7-N系列

    北京2024年5月10日 /美通社/ -- 近日,浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列。该系列依托浪潮信息自研分布
    的头像 发表于 05-10 16:37 438次阅读
    为大模型专门优化 <b class='flag-5'>浪潮信息</b>发布<b class='flag-5'>分布式</b>全闪<b class='flag-5'>存储</b>AS13000G7-N系列

    浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列

    近日,浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎D
    的头像 发表于 05-08 09:38 571次阅读
    <b class='flag-5'>浪潮信息</b>发布为大模型专门优化的<b class='flag-5'>分布式</b>全闪<b class='flag-5'>存储</b>AS13000G7-N系列

    一图读懂浪潮信息新一代分布式全闪存储AS13000G7-N系列

    一图读懂浪潮信息新一代分布式全闪存储AS13000G7-N系列
    的头像 发表于 05-08 09:35 1288次阅读
    一图读懂<b class='flag-5'>浪潮信息</b>新一代<b class='flag-5'>分布式</b>全闪<b class='flag-5'>存储</b>AS13000G7-N系列

    浪潮信息IPF24: 发展人工智能+,创新需要激发活力、拓展路径、加速落地

    北京2024年4月18日 /美通社/ -- 4月17日,浪潮信息北京举办的生态伙伴大会IPF2024上提出,发展人工智能+,要坚持"以应用为导向,以系统为核心",着重激发创新活力、拓展创新
    的头像 发表于 04-18 21:19 334次阅读
    <b class='flag-5'>浪潮信息</b>IPF24: 发展<b class='flag-5'>人工智能</b>+,创新需要激发活力、拓展路径、加速落地

    浪潮信息生态伙伴大会IPF2024:发展人工智能+,加速创新落地

    4月17日,浪潮信息北京举办的生态伙伴大会IPF2024上提出,发展人工智能+,要坚持“以应用为导向,以系统为核心”,着重激发创新活力、拓展创新路径、加速创新落地,推动人工智能成为百
    的头像 发表于 04-18 09:12 637次阅读

    XEDP与KeyarchOS完成浪潮信息澎湃技术认证

    澎湃技术认证。 经联合测试, 双方产品功能兼容性良好,整体运行流畅,性能表现优异,满足用户云计算、大数据、人工智能领域对企业级数据存储的多种需求。  
    的头像 发表于 02-27 17:56 477次阅读
    XEDP与KeyarchOS完成<b class='flag-5'>浪潮信息</b>澎湃技术认证

    嵌入人工智能的就业方向有哪些?

    嵌入人工智能的就业方向有哪些? 新一轮科技革命与产业变革的时代背景下,嵌入人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时
    发表于 02-26 10:17