0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

郑纬民院士:内存型长记忆存储以存换算是AI推理新趋势

要长高 2024-11-01 16:03 次阅读

在10月29日由中国电子工业标准化技术协会举办的数据存储专业委员会(简称“数据存储专委会”)成立大会上,汇聚了产业界代表、专委会成员及多位院士专家,共逾百人,共同探讨了数据存储产业的发展,并见证了数据存储专业委员会的正式成立。会上,中国工程院院士、数据存储专委会名誉会长郑纬民发表了题为“AI存储:人工智能大模型的基石”的主旨演讲。

郑纬民院士指出,人工智能进入大模型时代展现出两大特征:一是基础大模型迈入多模态时代,实现了从单一文本到图片、视频等多模态信息的综合应用;二是大模型已在金融、医疗、智能制造等多个领域得到实际应用。

针对大模型的四个关键环节,郑纬民院士详细阐述了存储在大模型训练和推理应用中所面临的挑战及相关技术:

首先,数据获取阶段,大模型训练需要海量的原始数据,这些数据需被存储设备妥善保存。随着大模型从单模态向多模态发展,产生了数以百亿计的小文件,这对文件系统的目录扩展性、读写速度以及存储的低延迟和高可扩展性提出了更高要求。

其次,数据预处理阶段,由于原始数据质量参差不齐,存在大量重复和低质量数据,因此需要进行预处理以提升数据质量。以ChatGPT4级别的大模型为例,其训练过程可能需要1万块A100显卡耗时11个月,其中数据预处理可能占据一半以上的时间,这与数据存储的性能密切相关。

再次,模型训练阶段,大规模训练系统(如10万块显卡组成的系统)的可靠性难以保证,频繁出现故障,导致集群可用度低下。为了快速恢复训练,需要依赖高性能的存储系统来快速读取CheckPoint数据。华为与清华大学MADSys实验室联合开发的高性能AI存储系统在此方面表现出色,曾在国际权威机构MLPerf Storage基准评测中获得第一名,性能密度是第二名的两倍。

最后,模型推理阶段,这是与AI应用最直接相关的环节。更高效的人工智能需要处理更多数据、使用更大模型以及更长的上下文窗口,但这同时也带来了极重的推理负载。模型参数以及推理过程中产生的KV-Cache需要巨大的存储空间。为此,国内优秀的大模型应用Kimi与清华大学MADSys实验室共同推出了Mooncake分离式推理架构,通过保存共享的KV-Cache,采用以存换算的策略大幅提升系统吞吐。

郑纬民院士强调,模型推理过程是一个复杂的存储系统工程,关键在于存储容量大、传输速度快以及性价比高。清华大学MADSys实验室联合华为数据存储、9#AISoft、阿里云、面壁、趋境等公司共同开发的高性能内存型长记忆存储系统即将开源发布,该系统能够实现大范围全局共享与持久化KV-Cache,以存换算,共同构建大模型时代下的高性能内存型长记忆存储系统生态。

最后,郑纬民院士总结指出,AI存储是人工智能大模型的基石,贯穿于大模型生命周期的每一个环节。通过以存强算、以存换算,先进的AI存储能够提升训练集群的可用度,降低推理成本,提升用户体验。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4332

    浏览量

    85960
  • AI
    AI
    +关注

    关注

    87

    文章

    31158

    浏览量

    269524
  • 人工智能
    +关注

    关注

    1792

    文章

    47445

    浏览量

    239050
收藏 人收藏

    评论

    相关推荐

    AI驱动新型存储器技术,国内新兴存储企业进阶

    生成式AI对于算力、运力和力的需求与日俱增,如何打破“存储墙”成为存储行业面临的挑战与机会。从因AI训练而爆红的HBM,再到DDR5、PC
    发表于 10-16 08:10 991次阅读
    <b class='flag-5'>AI</b>驱动新型<b class='flag-5'>存储</b>器技术,国内新兴<b class='flag-5'>存储</b>企业进阶

    苏茨克维预测:推理AI将带来不可预测性

    未来的人工智能将展现出类似人类的推理能力。 苏茨克维强调,随着AI推理能力的提升,事情将变得更加难以预测。他解释说,推理能力的增强意味着AI
    的头像 发表于 12-17 09:55 221次阅读

    科技启动首届内计算创新大赛

    内计算作为一项打破“内存墙”“功耗墙”的颠覆性技术,消除了与算的界限,相比CPU或GPU能够实现更高计算并行度、更大专用算力,达成数量级的能效提升。在AI加速落地的
    的头像 发表于 11-21 10:44 265次阅读

    华为发布数据通信未来技术趋势报告

    近日,CCF中国网络大会(CCF ChinaNet 2024)期间,由中国计算机学会主办的“算网融合·数智赋能·发展新质生产力”主题论坛成功举办。论坛邀请了邬江兴、吴建平、、张宏科多位
    的头像 发表于 11-18 11:28 451次阅读

    王耀南院士AI大模型赋能人形机器人及未来趋势

    研究现状,关键技术赋能具身智能人形机器人,以及未来的发展趋势与展望四个方面进行汇报。 王院士认为人工智能大模型推动人形机器人在感知、认知、思考、分析、判断、推理、交互的智能自主作业方向发展。随后
    的头像 发表于 11-08 11:03 802次阅读
    王耀南<b class='flag-5'>院士</b>:<b class='flag-5'>AI</b>大模型赋能人形机器人及未来<b class='flag-5'>趋势</b>

    面向未来数据中心的存储平台技术挑战与探索

    近日,中国计算机学会第十三期CCF秀湖会议在苏州CCF业务总部&学术交流中心正式拉开帷幕。本次会议就“新应用与硬件驱动下的存储技术创新”主题进行深入交流和探讨。中国工程院院士、清华大学
    的头像 发表于 11-06 10:43 247次阅读

    AMD助力HyperAccel开发全新AI推理服务器

    HyperAccel 是一家成立于 2023 年 1 月的韩国初创企业,致力于开发 AI 推理专用半导体器件和硬件,最大限度提升推理工作负载的存储
    的头像 发表于 09-18 09:37 381次阅读
    AMD助力HyperAccel开发全新<b class='flag-5'>AI</b><b class='flag-5'>推理</b>服务器

    智驭未来,AI拼才会赢—弘孟董事寄语工业富联,拼搏共赢新篇章

    奥运会马上就要开始,Fii工业富联发布《弘孟董事致工业富联全体同仁的一封信》,在全球AI竞赛浪潮中,AI已经成为公司未来发展的核心驱动力,如何让
    的头像 发表于 07-14 08:33 470次阅读
    智驭未来,<b class='flag-5'>AI</b>拼才会赢—<b class='flag-5'>郑</b>弘孟董事<b class='flag-5'>长</b>寄语工业富联,拼搏共赢新篇章

    AI浪潮下的十大消费者新趋势

    人工智能已经风靡全球,当我们沉浸在AI技术为办公与生活带来的各种便利时,一些人也会质疑:AI 真的能为我们描绘出更美好的未来画卷吗? AI 赋能的十大消费者趋势 爱立信消费者实验室的最
    发表于 06-05 10:30 372次阅读

    第十三期CCF秀湖会议:共话未来数据中心的存储平台技术挑战与探索

    、清华大学教授,华中科技大学金海教授,清华大学舒继武教授,浪潮存储产品线总经理李辉等20余位专家出席会议。秀湖会议AC主席、CCF副理事
    的头像 发表于 06-04 16:33 387次阅读
    第十三期CCF秀湖会议:共话未来数据中心的<b class='flag-5'>存储</b>平台技术挑战与探索

    英特尔助力京东云用CPU加速AI推理大模型构建数智化供应链

    英特尔助力京东云用CPU加速AI推理大模型构建数智化供应链
    的头像 发表于 05-27 11:50 560次阅读
    英特尔助力京东云用CPU加速<b class='flag-5'>AI</b><b class='flag-5'>推理</b>,<b class='flag-5'>以</b>大模型构建数智化供应链

    科技助力AI应用落地:WTMDK2101-ZT1评估板实地评测与性能揭秘

    计算: 近计算:在近计算中,计算单元与高速存储单元(如高速缓存)紧密集成。这意味着处理器和高速存储单元之间的距离很近,可以快速访问数据并进行计算,减少了数据从
    发表于 05-16 16:38

    内计算WTM2101编译工具链 资料

    内计算是突破物理极限的下一代算力技术- AIGC等人工智能新兴产业的快速发展离不开算力,算力的基础是人工智能芯片。 当前CPU/GPU在执行计算密集任务时需要将海量参数(ωij)从内存
    发表于 05-16 16:33

    如何看待半导体行业未来的新趋势

    如何看待半导体行业未来的新趋势
    的头像 发表于 04-25 11:38 768次阅读
    如何看待半导体行业未来的<b class='flag-5'>新趋势</b>

    AI时代,强则强

    强算,强训,强安
    的头像 发表于 03-22 09:17 2193次阅读
    <b class='flag-5'>AI</b>时代,<b class='flag-5'>存</b>强则强