0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

神州鲲泰推出全新智算架构及硅光+液冷整机柜,破解多云异构绿色智算难题

科技数码 来源:科技数码 作者:科技数码 2024-05-15 16:37 次阅读

在数字经济时代,算力资源已经成为新的“能源”,为人工智能云计算等等科技界前沿领域持续供能。5月9日,数云原力大会2024在神州数码国际创新中心(IIC)盛大召开。在开幕式上,神州数码副总裁、神州数码信创控股董事长韩智敏重磅发布新一代神州鲲泰绿色异构智算中心全液冷整机柜新品,在异构智算的时代,通过软硬件协同创新,为客户提供性能强、能效高、节能环保的新选择。

异构智算时代,企业智算落地如何兼顾效率与成本?

我们迎来了一个全新的异构智算时代。在当前的算力环境下,多云异构智算基础设施已成为必然。异构算力资源如何得到充分利用?在混合云部署下,如何应对算力构建选型、部署、运维复杂度和难度的挑战?这个独特的“智算攒机时代”,正在呼唤全新的智算架构。

与此同时,随着大模型和生成式AI加速落地,大量的模型训练和推理任务,在唤醒底层算力海量需求的同时,也对资源利用率提出了巨大挑战。有关资料显示,OpenAI训练GPT-4的MFU(Model Flops Utility)在32%到36%之间。而目前行业MFU利用率的平均水平仅为30%~40%,智算资源利用率尚有很大的提升空间,利用率提升也将为企业节省大量成本。

能耗是另一个大的挑战,算力本身会成为主要的能耗和二氧化碳排放来源。明显可预见的就是,GPU的能耗本身是CPU能耗的2倍以上。根据MIT研究表明,未来人类需要为人工智能相关应用新增10%的能源需求。也就是说,“炼”大模型会比炼钢还费电。对于一个企业来说,每新增一个用于智算的机架,其运行一年约等于增加15w度电,约等于100个家庭的年用电量,约等于1.5吨二氧化碳排放,能耗和碳排放十分巨大。

尽精微,神州鲲泰异“双管齐下”提升算力资源利用率

神州鲲泰推出HISO异构智算调度运营平台、HICA异构智算加速平台,有效解决智算集群间以及集群内面临的复杂异构兼容问题,并显著提升算力资源的利用率。

HISO异构智算调度运营平台,基于云原生技术,整合GPU硬分片和虚拟分片技术,能实现GPU资源虚拟化或池化,完成跨集群之间的算力调度。根据用户业务需求,该平台可以在整个异构智算资源池中匹配优选算力组合,提升GPU服务器集群的资源使用率。HISO异构智算调度运营平台拥有将国内外GPU资源混合组网、混搭调度,算力精细隔离等关键能力,可以“像管理一台GPU主机一样,管理和调度多个集群的GPU资源”。通过GPU容器直通、IaaS卸载,该平台加速了模型加载时间,相比传统方式,模型加载速度提升3倍。同时还能实时收集智算中心全栈、全链路指标,发现和定位软硬件故障,实现算力可观测性。

HICA异构智算加速平台则着重解决集群内部的算力调度优化问题,通过屏蔽集群内底层算力生态差异,突破关键计算效率瓶颈,有效提升算力利用率与可用性。HICA异构智算加速平台通过自研的服务层、中间适配层以及调度编排算法,采用数据并行、模型并行等方式,把并行计算任务进行有效分解,匹配相应的软件栈和算力资源来承接。当GPU资源变化,该平台可以实时动态调度计算子任务并调整模型拓扑和架构,以充分聚合各种算力资源。

HICA异构智算加速平台具有一云多芯特性,支持国内外主流AI芯片,可实现训练推理任务在不同品牌、不同型号芯片组成的智算集群中的混合训练推理,预计可降低20%闲置算力。

此外,根据不同模型、不同算子之间集合通信流特点,该平台还可自适应选择最合适的通信参数,达到更高的通信效率。同时,在不同模型运行过程中,充分考虑存算比要求的不同,HICA异构智算加速平台还可从宏观到微观多个尺度选择最合适的存算比资源加载模型,加速吞吐,降低时延,使MFU提升10~20%,MBU提升5%。

硅光+液冷,一体化交付冷却跳动的电表

随着生成式AI落地对算力需求的暴涨、带宽的狂飙提速,智算中心节点的高能耗痛点日益加剧。而以一个万卡智算中心为例,采用200G接口互联,需要约80000个光模块,其互联所需的能耗则占到总体的5%。节点间互联的高能耗问题也日益凸显。

针对节点间互联的能耗问题,神州鲲泰采用硅光技术,通过单光源多调制器,降低调制器电压,同时采用分布式反馈激光器等一系列技术,有效降低25%的互联能耗。

同时,针对节点的能耗问题,神州鲲泰推出液冷服务器,通过一体化冷板,智能流量调节来提升系统的散热效率,采用负压管线系统,漏液近端探测技术,并联动服务管控系统提升冷却系统的可靠性,有效降低30%的节点能耗。

而为了帮助客户规避接口多、接头复杂、现场实施部署难度大、实施周期长等难题,数云原力大会2024开幕式上,神州鲲泰正式发布“KunTai Pod2000全液冷整机柜”方案产品。采用一体化交付方式,有效降低部署和运维的复杂度的同时,整机柜还能实现100%全液冷及高性价比液冷方案,助力数据中心PUE迈向1.15,并且凭借60KW+的最大单柜功率,实现1.5倍于行业平均水平的能效比,在为客户提供强打算力的同时有效控制能耗成本。

随着2022年底ChatGPT的问世,AI正成为推动创新的核心引擎。现在的IT基础架构已经到了一个由模型和算力相互促进,螺旋上升的新发展阶段。面对新的发展机遇,神州鲲泰从智算中心系统整体性能提升出发,提出了走新智算架构之路的策略,建立了高通量、高并行、高效率,低能耗的多样化智算架构。新的智算架构能够快部署、低投入地突破算力瓶颈,构建出性能更优、成本更低、能效更高的智算中心。未来每个智算中心,每台计算机都将是这样一种新的智算架构,从而实现算力的普惠。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 硅光
    +关注

    关注

    0

    文章

    35

    浏览量

    8961
  • AI
    AI
    +关注

    关注

    87

    文章

    30637

    浏览量

    268821
  • 架构
    +关注

    关注

    1

    文章

    511

    浏览量

    25468
  • 算力
    +关注

    关注

    1

    文章

    960

    浏览量

    14784
收藏 人收藏

    评论

    相关推荐

    首个液冷整机柜服务器行业标准发布,兰洋科技核心参编!

    近日,在工信部发布的2024年第28号文件中,由中国信通院牵头制定,超聚变、中国电信、中国联通、中国移动、兰洋科技等单位核心参编的《冷板式液冷整机柜服务器技术要求和测试方法》(标准编号YD
    的头像 发表于 12-16 14:30 80次阅读
    首个<b class='flag-5'>液冷</b><b class='flag-5'>整机柜</b>服务器行业标准发布,兰洋科技核心参编!

    实践丨神州助力数字龙江智中心跑出行业智能化加速度

    过去的几年中,中国智基础设施建设呈现开花状态,各地纷纷加快数字基建项目的建设步伐,智中心成为布局重点。从北京到四川,从宁夏到河南,多地智中心项目相继开工或投入使用,彰显出我国在人工智能和大数
    的头像 发表于 11-06 19:24 510次阅读

    异构,打赢智时代「牧野之战」

    商周大战?周武王用「异构」拿下战场!
    的头像 发表于 07-24 14:13 1765次阅读
    <b class='flag-5'>异构</b>智<b class='flag-5'>算</b>,打赢智<b class='flag-5'>算</b>时代「牧野之战」

    神州亮相北京数字安全大会,以智能力构筑数据安全的坚实底座

    力正成为赋能各行各业数字化转型的基础技术要素,神州面对智时代多云
    的头像 发表于 07-18 16:06 436次阅读
    <b class='flag-5'>神州</b><b class='flag-5'>鲲</b><b class='flag-5'>泰</b>亮相北京数字安全大会,以智能<b class='flag-5'>算</b>力构筑数据安全的坚实底座

    异构混训整合不同架构芯片资源,提高力利用率

    的解决方案。通过混合使用多种异构芯片,可以充分利用不同芯片的优势,提高力利用率,降低力成本,并推动AI技术的广泛应用。   异构混训能够整合不同
    的头像 发表于 07-18 00:11 3431次阅读

    神州亮相WAVE SUMMIT深度学习开发者大会2024,以智能力搭配大模型推动产业数智化变革

      6月28日,由深度学习技术及应用国家工程研究中心主办,百度飞桨、文心大模型联合承办的WAVE SUMMIT深度学习开发者大会2024在北京成功举办,神州亮相活动并带来全新的AI
    的头像 发表于 07-01 16:48 4.4w次阅读
    <b class='flag-5'>神州</b><b class='flag-5'>鲲</b><b class='flag-5'>泰</b>亮相WAVE SUMMIT深度学习开发者大会2024,以智能<b class='flag-5'>算</b>力搭配大模型推动产业数智化变革

    神州亮相WAVE SUMMIT深度学习开发者大会2024,以智能力搭配大模型推动产业数智化变革

    在人工智能蓬勃发展的当下,神州持续深化与互联网企业的合作,联合为客户打造更多力更强大、部署更便捷、业务应对更敏捷的大模型一体机解决方案,以智能
    的头像 发表于 07-01 16:22 347次阅读
    <b class='flag-5'>神州</b><b class='flag-5'>鲲</b><b class='flag-5'>泰</b>亮相WAVE SUMMIT深度学习开发者大会2024,以智能<b class='flag-5'>算</b>力搭配大模型推动产业数智化变革

    助力全国一体化力网建设,神州力构建新质生产力

    力助推新质生产力发展的道路。“成为领先的创新智基础设施提供商”一直是神州的愿景,在本次活动上,神州
    的头像 发表于 06-24 16:57 571次阅读
    助力全国一体化<b class='flag-5'>算</b>力网建设,<b class='flag-5'>神州</b><b class='flag-5'>鲲</b><b class='flag-5'>泰</b>以<b class='flag-5'>算</b>力构建新质生产力

    新闻丨第七届数字中国建设峰会正式启幕,神州携手天翼云共筑智云生态

    是展示数字中国建设成就的盛会,本次峰会以“释放数据要素价值,发展新质生产力”为主题,神州作为中国电信天翼云重要合作伙伴受邀参展“智云生态大会”。同时,
    的头像 发表于 05-24 15:15 492次阅读
    <b class='flag-5'>鲲</b><b class='flag-5'>泰</b>新闻丨第七届数字中国建设峰会正式启幕,<b class='flag-5'>神州</b><b class='flag-5'>鲲</b><b class='flag-5'>泰</b>携手天翼云共筑智<b class='flag-5'>算</b>云生态

    新闻|神州创新智之旅北京站开幕,发布全新架构液冷整机柜产品应对 “多云异构绿色

    加速平台HICA以及一体化交付的神州液冷整机柜产品。帮助企业客户在整个
    的头像 发表于 05-22 10:56 369次阅读
    <b class='flag-5'>鲲</b><b class='flag-5'>泰</b>新闻|<b class='flag-5'>神州</b><b class='flag-5'>鲲</b><b class='flag-5'>泰</b>创新智<b class='flag-5'>算</b>之旅北京站开幕,发布<b class='flag-5'>全新</b>智<b class='flag-5'>算</b><b class='flag-5'>架构</b>和<b class='flag-5'>液冷</b><b class='flag-5'>整机柜</b>产品应对 “<b class='flag-5'>多云</b>、<b class='flag-5'>异构</b>、<b class='flag-5'>绿色</b>

    打造新型智中心,神州中标中移动智中心采购

    5月16日,中国移动采购与招标网发布了《中国移动2024年至2025年新型智中心采购中标候选人公示》,神州数码集团股份有限公司下属控股子公司神州
    的头像 发表于 05-17 15:54 318次阅读
    打造新型智<b class='flag-5'>算</b>中心,<b class='flag-5'>神州</b><b class='flag-5'>鲲</b><b class='flag-5'>泰</b>中标中移动智<b class='flag-5'>算</b>中心采购

    神州与中电标联合成立云计算应用软件适配研究中心

    研究中心成立暨专题组2024年第二季度工作会议在厦门隆重举行,这也是神州2024创新智之旅的开端。厦门市政协副主席李钦辉,中国工程院院士沈昌祥,中国电子技术标准化研究院副院长范科
    的头像 发表于 05-09 14:04 405次阅读
    <b class='flag-5'>神州</b><b class='flag-5'>鲲</b><b class='flag-5'>泰</b>与中电标联合成立云计算应用软件适配研究中心

    神州携智系列产品亮相2024华为北京政企合作伙伴大会

    政企合作伙伴大会在京隆重举办,在人工智能蓬勃发展的当下,向合作伙伴分享市场发展趋势、前进方向以及华为在智和产业端的全新举措,与合作伙伴一起踔厉奋发、携手共进。近千位合作伙伴受邀到场参会,共谱北京数字产业新篇章,神州
    的头像 发表于 04-22 16:27 481次阅读
    <b class='flag-5'>神州</b><b class='flag-5'>鲲</b><b class='flag-5'>泰</b>携智<b class='flag-5'>算</b>系列产品亮相2024华为北京政企合作伙伴大会

    权威认证,神州数码旗下神州14款服务器通过政府采购需求标准测试!

    版)》,充分展现了神州系列产品的技术领先性、高标准的产品质量、完整的生态适配能力。此次批量通过的14款神州
    的头像 发表于 03-25 22:12 494次阅读

    中国电信规划在上海建设首个国产超大规模液冷集群

    中国电信规划建设首个国产超大规模液冷集群 人工智能技术的快速发展催生了巨大的力需求;中国电信规划在上海规划建设可支持万亿参数大模型训练的智集群中心。其中会搭载
    的头像 发表于 02-22 18:48 1321次阅读