0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

探讨大模型时代背景下数据存储的变革之道

浪潮存储 来源:浪潮存储 2024-12-16 14:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在当今数字化浪潮汹涌澎湃的时代背景下,大模型技术犹如一颗璀璨的明星,照亮了科技发展的广阔苍穹,而存储技术的变革,作为这一进程中的坚实基石,正日益成为产业界与学术界共同瞩目的核心焦点。

为此,浪潮信息联合DOIT推出《有数·高端对话》栏目,分布式存储产品线总经理姜乐果及DOIT传媒主编李祥敬,与特邀嘉宾上海交通大学吴晨涛和中科闻歌陈思含共同围绕大模型的存储需求变化,展开了一场深度对话。深入探讨大模型时代背景下数据存储的变革之道,共话数字经济的创新发展,进一步夯实数据基础设施,充分释放数据资源的巨大价值,为广大行业同仁及用户提供价值参考与启示。

大模型驱动存储变革

大模型技术的迅猛发展对存储系统提出了极为严苛的要求。以GPT-4为例,其参数量达到了2200亿,每张GPU配备的HBM显存带宽达1.6TB/s,整体训练所需的显存容量接近400TB。根据Meta等公司的调研数据显示,大模型在运行过程中会频繁遭遇内存故障,平均每2-3小时便可能导致一次训练中断,这无疑对存储系统的安全可靠性提出了极高的标准。吴晨涛教授以GPT-4等前沿模型作为实例,清晰阐明了大容量HBM显存、高带宽以及高可靠性是存储系统不可或缺的三大核心特性。

同时,从宏观角度出发,吴教授呼吁建立开放的数据生态。在这一生态中,通过强化监管与隐私保护,旨在打破数据孤岛,促进数据的流动与共享,为高质量数据的充分涌流开辟道路,从而为行业大模型的发展提供持续不断的动力。

作为存储厂商的代表,姜乐果从存储技术进化的视角出发,详细阐述了在大模型驱动下,传统计算与当前智算中心存储设施的全方位变革。在性能层面,智算中心对存储性能的要求已从百GB级跃迁至TB级,与算力协同攀升;在容量维度,存储系统已从PB级大步迈向EB级,轻松应对海量数据洪流的冲击。同时,数据格式与协议的多元化与复杂性日益显著,这对存储系统突破兼容壁垒提出了迫切需求。

姜乐果还展示了企业在数据要素市场的积极布局与创新探索。浪潮信息紧跟政策导向,与多方合作伙伴携手,深入挖掘行业需求,精心研发端到端的解决方案及高性能存储新品。例如,新一代分布式存储平台AS13000G7系列产品在MLPerf AI存储基准评测中表现出色,在3D-UNet(医学图像分割)和CosmoFlow(宇宙学参数预测)两个应用场景共计8项测试中,斩获5项全球第一,彰显强大的性能实力,为行业大模型数据存储难题提供有力支撑。

中科闻歌作为一家专注于复杂数据解析和AI辅助决策的人工智能公司,陈思含分享了中科闻歌在大模型实践中的宝贵经验。在大模型的发展历程中,存储需求经历了显著的动态演变:从早期对训练速度的追求导致存储性能需求激增,到参数量膨胀带来的数据量与参数规模指数级增长,再到多模态数据处理对存储复杂性的严格要求,以及混合读写模式和多样化应用场景引发的多元化需求。

数据质量作为行业大模型发展的核心驱动力,中科闻歌在此方面进行了创新实践。集成了全球多语言媒体数据的闻海大数据平台,运用跨模态AI技术融合信息,构建了垂直领域知识库,并提供模块化的智能大屏工具。这一平台不仅具备全球范围内高效、安全获取和处理高质量数据的能力,还成为训练大模型所需高质量数据的主要数据源和知识库。

在为客户提供大模型落地产品和系统时,中科闻歌采取了混合模式,即结合公司自身海量数据与用户的私有行业数据进行模型训练和应用构建,确保了客户的数据安全,避免了数据出域的风险。

协同创新下的趋势展望

展望未来存储发展,吴晨涛教授立足学术前沿,前瞻性地预判了关键技术走向。他认为,跨域资源调度共享技术,特别是基于CXL协议的内存池创新,将打破资源限制,实现全域资源的灵动调配。同时,优化元数据管理将提升数据检索与处理效率,而内存故障预测及 Checkpointing 技术则能确保系统稳定运行,最大限度地减少故障对数据处理连续性和完整性的影响。这些技术的迭代升级将为存储技术的发展指明方向。

作为存储厂商的代表,浪潮信息积极拥抱变革,从Storage for AI深度适配需求,到AI for Storage智能赋能提效,再到与大模型企业紧密合作,精准挖掘系统性能潜能,为用户提供更贴合业务的产品。

作为大模型企业的代表,中科闻歌致力于打造高效、安全和可靠的存储系统,以适应大模型时代的新要求。在架构上,采用存算分离架构部署AI-Ready数据基础设施,以加速智能应用。在效率提升方面,全闪存存储凭借其卓越性能成为破局关键,能够加速数据流转,激活数据价值。而在安全防护层面,中科闻歌构建主动防御体系,从内核强化存储安全,筑牢安全防线。

此次对话栏目的成功举办,不仅搭建了产学研用之间的沟通桥梁,还为各方的深度合作提供了宝贵的机会。各方代表能够相互交流思想、碰撞火花,共同探讨大模型时代下的存储技术变革。这一举措为产学研用四方携手共进创造了难得契机,共同迎接大模型时代带来的存储变革浪潮,推动我国存储产业的繁荣发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据存储
    +关注

    关注

    5

    文章

    1039

    浏览量

    53036
  • 浪潮
    +关注

    关注

    1

    文章

    491

    浏览量

    25498
  • 大模型
    +关注

    关注

    2

    文章

    3857

    浏览量

    5289

原文标题:浪潮信息《有数·高端对话》:大模型时代存储变革,产学研用共探新局

文章出处:【微信号:inspurstorage,微信公众号:浪潮存储】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    探讨AI时代Arm的关键价值

    人工智能 (AI) 已不再是孤立的技术门类,而是融入各类设备、企业工作流程与云基础设施的底层能力。在此背景,行业面临的核心挑战,已不再局限于打造性能更强的 AI 模型,而是如何在实际业务环境中实现高效部署与规模化落地。
    的头像 发表于 05-19 17:20 1292次阅读

    AI Ceph 分布式存储教程资料大模型学习资料2026

    瓶颈:从传统存储向 AI 专用架构演进 在大模型训练场景,计算节点(GPU)的运算速度极快,往往在毫秒级就能完成一轮数据的处理。如果后端存储
    发表于 05-01 17:35

    AI大模型微调企业项目实战课

    的战略问题浮出水面:过度依赖公有云上的通用大模型,意味着企业的核心数据、商业机密乃至业务逻辑,都时刻暴露在潜在的隐私泄露和“数据断供”风险之中。在这样的时代背景
    发表于 04-16 18:48

    当 AI 遇上 ICY DOCK 硬盘盒:企业 AI 基础设施的存储革新之道

    在生成式AI的浪潮中,数据已成为新时代的"石油",而存储则成为AI算力的"生命线"。当AI大模型的训练需要海量数据吞吐,当推理侧需要本地化的
    的头像 发表于 03-13 14:54 970次阅读
    当 AI 遇上 ICY DOCK 硬盘盒:企业 AI 基础设施的<b class='flag-5'>存储</b>革新<b class='flag-5'>之道</b>

    ReRAM:AI时代的潜力存储技术

    电子发烧友网报道(文/李弯弯)在当今科技飞速发展的时代存储技术作为信息社会的基石,不断推动着各个领域的创新与变革。其中,ReRAM(阻变存储器,即电阻式随机存取
    的头像 发表于 02-25 09:04 4959次阅读

    AI技术发展驱动数据存储体系变革

    存储与传输能力作为支撑。当生成式AI爆发式增长,边缘AI快速普及,数据存储的容量、速度、能效与定制化需求迎来颠覆性变革
    的头像 发表于 02-11 15:09 1742次阅读
    AI技术发展驱动<b class='flag-5'>数据</b><b class='flag-5'>存储</b>体系<b class='flag-5'>变革</b>

    Aumovio案例研究 | 软件即产品(SWaap)背景模型系统工程与闭环系统验证

    )的应用背景,本案例需要基于Level1虚拟ECU,实现电动尾门的模型化系统工程和闭环系统验证。同时,需要确保虚拟系统行为与真实系统具有足够的一致性与准确性。SW
    的头像 发表于 01-07 10:04 763次阅读
    Aumovio案例研究 | 软件即产品(SWaap)<b class='flag-5'>背景</b><b class='flag-5'>下</b>的<b class='flag-5'>模型</b>系统工程与闭环系统验证

    OCPInspired认证背后的技术底气,闪迪如何叩开AI时代存储大门?

    存储走向台前,成为释放AI生产力的关键。在此背景,闪迪PCIe Gen 5.0企业级SSD SANDISK® SN861 NVMe SSD凭借卓越的产品效率、影响力、开放性、可扩展性和可持续性,斩获开放计算组织(OCP)In
    的头像 发表于 12-01 12:41 379次阅读
    OCPInspired认证背后的技术底气,闪迪如何叩开AI<b class='flag-5'>时代</b><b class='flag-5'>存储</b>大门?

    深圳南柯电子|灯具EMC整改:低碳时代,能效与兼容性的平衡之道

    深圳南柯电子|灯具EMC整改:低碳时代,能效与兼容性的平衡之道
    的头像 发表于 11-20 10:00 695次阅读

    RISC-V嵌入式开发书里面的存储模型里面的释放和获取

    如下图是胡振波先生的书《RISC-V架构与嵌入式开发快速入门》第344页附录D存储模型背景介绍中D.3节的内容。请问“无须屏障其之后的操作”和“无须屏障其之前的操作”是什么意思? “无须屏障其之后
    发表于 11-05 07:55

    佰维存储:AI时代存储解决方案

    存储支持。然而,带宽和容量提升的同时,尺寸和功耗却成为瓶颈,存储必须在同等体积里做到更大容量、更高带宽、更高集成以及更低功耗。     何瀚认为,在这样的背景,仅靠传统的“通用模组
    的头像 发表于 09-30 08:40 1.2w次阅读
    佰维<b class='flag-5'>存储</b>:AI<b class='flag-5'>时代</b>的<b class='flag-5'>存储</b>解决方案

    数据驱动变革时代,自动驾驶研发如何破解数据跨境合规难题?

    当下正是一个由数据驱动的伟大变革时代。从ADAS到AD,每一次技术的跃迁都离不开海量道路数据的采集、标注与分析。以图像数据为例,它们是训练和优化感知算法、提升系统安全性的宝贵资源。然而
    的头像 发表于 09-12 17:33 2883次阅读
    <b class='flag-5'>数据</b>驱动<b class='flag-5'>变革时代</b>,自动驾驶研发如何破解<b class='flag-5'>数据</b>跨境合规难题?

    霄云科技银河存储:重构AI时代存储新范式

    在人工智能与高性能计算需求呈指数级增长的今天,数据存储的效率与可靠性已成为算力释放的关键支撑。上海霄云信息科技有限公司正式推出全新一代AI存储产品--霄云银河存储。这款专为人工智能
    的头像 发表于 08-21 10:36 1144次阅读
    霄云科技银河<b class='flag-5'>存储</b>:重构AI<b class='flag-5'>时代</b>的<b class='flag-5'>存储</b>新范式

    Melexis即将推出新型硅基高压RC缓冲器

    在当今科技以日新月异之势迅猛发展的时代背景,电力电子技术领域正经历着一场深刻且具有划时代意义的变革。 Melexis凭借其深厚的技术积淀与卓越的创新能力,推动着行业不断迈向新的高度。
    的头像 发表于 07-29 17:41 1105次阅读

    数据标注与大模型的双向赋能:效率与性能的跃升

    ​‌在人工智能蓬勃发展的时代,大模型凭借其强大的学习与泛化能力,已成为众多领域创新变革的核心驱动力。而数据标注作为大模型训练的基石,为大
    的头像 发表于 06-04 17:15 2342次阅读
    <b class='flag-5'>数据</b>标注与大<b class='flag-5'>模型</b>的双向赋能:效率与性能的跃升