0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CCF-TCIST走进浪潮信息 共话AI时代存储创新

全球TMT 来源:全球TMT 作者:全球TMT 2024-06-07 14:27 次阅读

CCF信息存储技术专委会走进浪潮信息 共话大模型时代的存储创新之道

北京2024年6月7日/美通社/ -- 近日,中国计算机学会信息存储技术专业委员会(CCF信息存储技术专委会)首场“走进企业”活动启动,来自CCF信息存储技术专委会、清华大学、北京大学、华中科技大学、华东师范大学、上海交通大学、上海理工大学等单位的十余位存储领域专家、学者走进浪潮信息,在“大模型时代数据中心存储技术创新和应用”的会议主题下,分别就“以数据为中心的存储技术协同创新”和“大模型新应用的存储技术挑战与探索”两个核心议题,共同探讨了在存储架构创新、近数据计算、多协议融合互通、GPU直通存储、故障预测等多个领域的前沿技术创新和产业洞察。

wKgaomZiqEiAeshiAADNMHNeu6U478.jpg


CCF信息存储技术专委会走进浪潮信息

“以数据为中心”加速到来,存储架构亟待创新

随着数字化、智能化的加速发展,社会产生的数据量呈现出爆炸式增长。IDC报告显示,中国数据量规模将从2022年的23.88ZB增长至2027年的76.6ZB,年均增长速度(CAGR)达到26.3%,为全球第一。同期,全球数据量规模预计增长一倍以上,到2027年将达到284.3ZB,年均增长速度(CAGR)达到22.6%。当数据变成重要的生产要素,其价值释放正加速“以数据为中心”的到来,这对存储架构创新提出了新的要求。

浪潮信息存储产品线首席架构师孙斌认为,作为数据的主要载体,数据中心呈现出大型集约化、边缘分散化的发展趋势,未来数据中心将实现“人机物”三元智联融合,提供全面服务且资源利用率趋向最优。但是,随着数据中心应用多样化与计算多元化的叠加,亟需一套新型存储架构来实现均衡全能存储服务,通过融合软硬件协同设计,实现介质、软件和数据的分离,从而可组合可共享,最终灵活支撑全场景综合负载。

北京大学助理教授张杰认为,存储架构创新将是一个长期性、持续性工程,最终是要解决所谓的“存储墙”问题。以数据为中心要求计算围着数据转,以减小数据搬运带来的性能瓶颈以及功耗,但冯·诺依曼架构是一个以计算为中心的架构,数据搬运已然成为当下大数据、大规模应用所面临的最大的问题。

华中科技大学的刘海坤教授提出,基于新型高速互连总线CXL实现单机内存扩展和分布式内存扩展,可以较好地解决大规模数据处理特别是大模型应用面临的“内存墙”问题,可能颠覆未来数据中心架构,推动存算融合向存算分离演进,同时使能以数据为中心的CPU、GPU、FPGA间的对等计算。但是,刘海坤也指出,目前CXL总线面临体系结构、操作系统编程模型等多方面的挑战,产业技术生态有待进一步完善。

wKgZomZiqEqAH5IIAAEgh0T5QQo750.jpg


探讨大模型时代数据中心存储技术创新和应用

Storage for AI,AI for Storage,推动大模型与存储的双向进化

如果说数据中心是数据的“集散地”,那么大模型就是数据的“掘金场”。随着大语言模型(LLM)以及生成式AI的飞速发展,数据规模和质量对模型精度的价值日趋凸显,这也推动存储技术成为提升人工智能生产力的关键环节,直接关乎到人工智能整体落地水平。同时,人工智能技术的进步,也正向回馈于存储技术创新之中,带动了智能化存储技术的发展。Storage for AI,AI for Storage,大模型与存储呈现出双向进化。

大模型开发通常涵盖数据归集、数据预处理、模型训练、应用推理几个流程阶段,其中跨设备、跨中心的数据准备往往耗时数周,同时大模型训练过程中存在海量的小文件读取,小文件的读写性能较差,进一步拉长了训练周期,对存储系统的容量、性能、稳定性等方面都带来了巨大挑战。

清华大学副教授陆游游表示,从大模型训练过程中反映出的数据特征来看,小文件读取和带宽的优化是非常重要的。同时随着模型参数量提升,对内存、HBM显存以及CXL远端内存等多层次内存的管理也变得更加重要,需要与计算更好地协同。此外,向量存储、参数存储等新兴的存储方式也需要予以关注。

浪潮信息一直深耕面向AIGC场景的新一代存储平台。通过全局缓存技术,突破多模态小文件训练瓶颈,创新性提出多协议融合互通技术,实现数据免迁移,构建全局文件管理平台,统一多源异构存储,数据管理更加便捷,引入GPU直通存储技术,大大缩短AI训练I/O路径,提高大模型训练效率。此外,浪潮信息也积极地围绕CXL2.0,QLC,PCIe Gen 5等新型硬件和协议等进行全面的适配和优化,提供更强大的存储性能,助力大模型系统创新及AI应用落地。

而在AI for Storage领域,人工智能在数据恢复、故障预测等场景中也体现出越来越高的技术价值。上海交通大学教授吴晨涛分享了分布式机器学习高可靠数据恢复机制的研究,包括分布式学习过程中硬盘故障恢复加速的研究以及故障和繁忙节点的混合全局图恢复方法;华东师范大学教授石亮分享了面向大规模存储场景的SSD故障预测及部署优化技术研究,包括差异化的机器学习SSD故障预测研究和基于预测备份的RAID快速恢复技术,主要针对当前大规模闪存存储系统故障预测性能不佳、故障恢复机制占用计算资源且速度慢的问题做了优化。

浪潮信息作为本次活动的东道主,存储产品线总经理李辉对各位专家的到来表示热烈欢迎,指出面向数据产业创新与大模型应用的存储需求,业界与学界的深度对接和交流将进一步拓展创新的边界。CCF信息存储技术专委会走进浪潮信息活动的成功举办,将有助于加快信息存储领域的学术创新到产业落地的转化,推动数据成为新质生产力的优质生产要素。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4257

    浏览量

    85645
  • AI
    AI
    +关注

    关注

    87

    文章

    30072

    浏览量

    268334
收藏 人收藏

    评论

    相关推荐

    浪潮信息AI存储性能测试的领先之道

    AI技术的无限可能。近日,在MLCommons的子项目MLPerf Storage v1.0性能基准评测中,浪潮信息再度展现了在AI存储领域的卓越实力。
    的头像 发表于 10-29 16:30 193次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>AI</b><b class='flag-5'>存储</b>性能测试的领先之道

    浪潮信息:元脑企智EPAI助力金融大模型快速落地

    近日,2024金融科技应用创新发展大会暨农村金融机构信息化发展创新座谈会在上海举办。浪潮信息推出元脑企智EPAI企业大模型开发平台,面向金融业务场景,实现7天完成POC验证、2个月上线
    的头像 发表于 09-20 16:07 302次阅读
    <b class='flag-5'>浪潮信息</b>:元脑企智EPAI助力金融大模型快速落地

    浪潮信息赵帅:开放计算创新 应对Scaling Law挑战

    北京2024年8月15日 /美通社/ -- 日前在2024开放计算中国峰会上,浪潮信息服务器产品线总经理赵帅表示,智能时代,开源模型和开放计算激发了人工智能产业生态的创新活力,面对大模型
    的头像 发表于 08-15 16:02 252次阅读
    <b class='flag-5'>浪潮信息</b>赵帅:开放计算<b class='flag-5'>创新</b> 应对Scaling Law挑战

    浪潮信息推出AIGC存储解决方案

    近日,在科技创新浪潮中,浪潮信息成功举办了“元脑中国行”全国巡展的杭州站活动,此次盛会不仅汇聚了业界的精英与目光,更见证了浪潮信息在AIGC(人工智能生成内容)领域的一次重大突破。会
    的头像 发表于 07-03 11:16 674次阅读

    浪潮信息推出基于新一代分布式存储平台AS13000G7的AIGC存储解决方案

    、新一代分布式存储AS13000G7自身产品优势,新方案从容应对大模型应用对存储性能、容量以及数据管理等方面的苛刻要求。同时,浪潮信息尝试性提出GPU计算集群算力与存储集群聚合带宽的推
    的头像 发表于 07-01 19:00 1375次阅读
    <b class='flag-5'>浪潮信息</b>推出基于新一代分布式<b class='flag-5'>存储</b>平台AS13000G7的AIGC<b class='flag-5'>存储</b>解决方案

    浪潮信息与北京伙伴共筑AI新生态

    近日,2024浪潮信息区域ISP伙伴战略签约仪式在京圆满落幕。此次盛会,浪潮信息与航天星桥、中天瑞合、圣世博泰、浩然泰同、浩普诚华、众创佳业等20家北京元脑生态伙伴共襄盛举,签署了战略合作协议。
    的头像 发表于 05-31 11:33 715次阅读

    9家元脑生态伙伴与浪潮信息签署亿级分销协议

    北京2024年5月24日 /美通社/ -- 5月23日,2024浪潮信息亿级分销合作伙伴签约仪式成功举办,浪潮信息与北京时空未来、上海金圭、济南希望等9家元脑伙伴签署亿级分销合作协议。浪潮信息与元脑
    的头像 发表于 05-25 17:14 184次阅读

    浪潮信息发布AS13000G7-N系列分布式全闪存储

    浪潮信息近日推出了专为大型AI模型优化的AS13000G7-N系列分布式全闪存储。该系列基于浪潮信息自研的分布式文件系统,结合新一代数据加速引擎DataTurbo,为用户提供卓越的
    的头像 发表于 05-14 10:03 518次阅读

    【中心动态】 走进浪潮信息

    5月8日,RISC-V国际人才培养认证中心主任蒋学刚一行,到访浪潮电子信息产业股份有限公司(以下简称“浪潮信息”),受到深圳区域副总经理段青云、产品经理陶耀民的热情接待。浪潮信息是全球
    的头像 发表于 05-13 17:42 413次阅读
    【中心动态】 <b class='flag-5'>走进</b><b class='flag-5'>浪潮信息</b>

    为大模型专门优化 浪潮信息发布分布式全闪存储AS13000G7-N系列

    北京2024年5月10日 /美通社/ -- 近日,浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎
    的头像 发表于 05-10 16:37 406次阅读
    为大模型专门优化 <b class='flag-5'>浪潮信息</b>发布分布式全闪<b class='flag-5'>存储</b>AS13000G7-N系列

    潞晨科技Colossal-AI浪潮信息AIStation完成兼容性互认证

    近日,潞晨科技的Colossal-AI大模型开发工具和浪潮信息的AIStation智能业务创新生产平台成功完成了兼容性互认证。这一合作意味着用户可以在AIStation平台上便捷地部署与调度Colossal-
    的头像 发表于 03-06 10:18 743次阅读

    智邦国际与KeyarchOS完成浪潮信息澎湃技术认证

    KeyarchOS V5完全兼容,整体运行稳定高效,满足用户的关键性应用需求,获得相应兼容性认证证书。     浪潮信息澎湃技术认证是基于多元、创新的通用计算平台,与供应链及软件服务等生态合作伙伴共同构建的产品互兼容性认证体系,包含"产品部件认证"、"平台软件认证"、
    的头像 发表于 01-25 13:51 416次阅读
    智邦国际与KeyarchOS完成<b class='flag-5'>浪潮信息</b>澎湃技术认证

    浪潮信息澎湃认证:浪潮信息集中式存储携手仪电云i-stack云操作系统软件完成兼容性认证

    近日, 仪电云i-stack云操作系统软件与浪潮信息集中式存储AS/HF系列产品完成并通过浪潮信息澎湃技术相互兼容性测试认证, 测试结果显示,仪电云i-stack云操作系统软件与浪潮信息
    的头像 发表于 12-08 16:40 612次阅读
    <b class='flag-5'>浪潮信息</b>澎湃认证:<b class='flag-5'>浪潮信息</b>集中式<b class='flag-5'>存储</b>携手仪电云i-stack云操作系统软件完成兼容性认证

    浪潮信息刘军:智算力系统创新 加速生成式AI产业发展

    北京2023年12月6日 /美通社/ -- 11月29日,在北京举行的2023人工智能计算大会(AICC)上,浪潮信息高级副总裁刘军在主题演讲《智算力系统创新 加速生成式AI产业发展》中分享了
    的头像 发表于 12-06 14:08 920次阅读
    <b class='flag-5'>浪潮信息</b>刘军:智算力系统<b class='flag-5'>创新</b> 加速生成式<b class='flag-5'>AI</b>产业发展

    数聚AI ∙ 智慧未来 | 浪潮信息存储助力企业基于大模型实现数字化创新

    ,更好地帮助企业实现数字化创新? 11月29日,由DOIT传媒举办的“数智创新 · AI未来”—2023中国数据与存储峰会在北京成功举办,浪潮信息
    的头像 发表于 11-30 16:25 417次阅读
    数聚<b class='flag-5'>AI</b> ∙ 智慧未来 | <b class='flag-5'>浪潮信息</b><b class='flag-5'>存储</b>助力企业基于大模型实现数字化<b class='flag-5'>创新</b>