0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD和惠普企业介绍新制造的超级计算机Frontier

中科院半导体所 来源:悦智网 作者:Charles 2022-11-03 16:07 次阅读

AMD和惠普企业介绍新制造的超级计算机Frontier。

当前全世界最快的超级计算机是美国田纳西州橡树岭国家实验室打造的Frontier,该计算机运算功能强大,运算速度比其他7台最快的超级计算机的总和还要高,是运算速度排名第二的计算机的2倍多。Frontier不仅是第一台突破每秒百亿亿次计算(exaflops)门槛的计算机,还在全球高能效超级计算机中排名第二。现在,协作制造Frontier的超微半导体公司(AMD)和惠普企业揭开了该超级计算机正常运转的电子诀窍。

Frontier由74个惠普企业Cray EX超级计算机柜组成,这些机柜共容纳超过9400个CPU。每个节点都包含1个优化的第三代AMD EPYC 64核2千兆赫Trento处理器,用于一般任务处理,以及4个AMD Instinct MI250X加速器,用于高度并行超级计算和人工智能AI)运算,此外,还有5太字节闪存,协助向GPU快速输送数据。Frontier总共包含9408个CPU、37632个GPU和8730112个内核,这些组件由145千米的网络电缆连接在一起。美国田纳西州橡树岭国家实验室表示,这台全球领先的超级计算机的功耗约为21兆瓦。

f0f8bc84-5a9f-11ed-a3b6-dac502259ad0.jpg

2022年5月,在德国汉堡的全球高性能计算大会上,Frontier展示了每秒1.1 exaflops的整体性能,成为全球500强超级计算机的巅峰。它还可能变得更快,理论峰值性能为2 exaflops。

另外,Frontier在最新的全球绿色500强中排名第二,该排名衡量超级计算机的能源效率。(这并不影响它在整体性能上成为全球最快的超级计算机。)不过,日本的MN-3作为先前全球绿色500强的榜首,每瓦能实现39.38 gigaflops(每秒10亿浮点运算),而Frontier的测试开发系统为每瓦52.23 gigaflops。

Frontier成功的一个关键在于采用AMD的Infinity Fabric互连架构,每个节点内CPU和GPU连接方式有助于增加CPU和GPU的一致性,即它们的共享数据视图完全相同。

得克萨斯州奥斯汀AMD公司GPU和加速处理数据中心的副总裁布拉德•麦克雷迪(Brad McCredie)说:“一致性对于提升性能非常重要。它能帮助你确保分配合适的处理器运行合适的工作负载。很容易使并行CPU处理小任务和GPU处理大型任务。”

在Frontier的开发中,AMD表示,其面对的最大的挑战是功率性能。“有很多文献说,要达到每秒百亿亿次运算,需要几十万个GPU和150兆到500兆瓦功率,而我们想要使用几万个GPU和20兆瓦功率来实现。”麦克雷迪说,“因此,开发过程中上上下下每个人都在追求效率。”

例如,Frontier的每个GPU上都紧密结合一个128千兆字节的高带宽内存。这可以帮助GPU克服计算机性能的一个著名瓶颈:内存和处理之间的数据传输。

此外,Frontier的每个GPU还使用了台积电生产的先进6纳米节点芯片。因此,“它们执行双精度浮点运算的速度与单精度浮点运算相同,这是一项重大创新。”麦克雷迪说。

借助这些进步,Frontier只需几万个GPU,而不需要几十万个GPU。“它承担所有的并行管理,将程序员身上的负担转移到硬件上。这使得该系统更易于编程。”麦克雷迪说。

一个“计算刀片”上有2个AMD节点,74个机柜中的每个都装有64个这种刀片。计算刀片通过惠普企业Slingshot连接器互连,每个连接器都有一个专门设计的64端口交换机,可提供每秒12.8太字节的网络带宽。各组刀片的连接采用一种被称为蜻蜓的拓扑结构,数百个机柜和数十万个节点都可以相互通信,任意两个节点之间最多可以跳转3次。

“Slingshot的部署得到了高度优化,根据所需距离合理采用能效最高的电缆,直连铜缆和有源光缆。”惠普企业资深会员和HPC/MCS的首席技术官迈克•伍德克(Mike Woodacre)说。他补充道,去除低效的通用器件“显著降低了线缆的能耗”。

机柜中计算机刀片的降温采用了液体冷却。惠普企业高性能计算和人工智能系统副总裁杰拉尔德•克莱恩(Gerald Kleyn)表示,这台超级计算机的密度能够达到传统风冷结构的5倍。其结果是,这种紧凑的系统反过来大大降低了布线要求和运行费用。

“突破百亿亿次计算的门槛很重要,同时位列全球绿色500强第二更是非凡。”克莱恩说。此外,他说,在疫情期间和全球性供应链问题的环境下,实现这一点“全靠美国橡树岭国家实验室、惠普企业和AMD之间强大的团队合作”。

Frontier下一步的工作包括继续测试和验证该系统。该实验室表示,2022年后期将继续进行最后验收和早期科学应用,计划于2023年初全面开放应用于科学项目。

已经计划在Frontier展开的项目包括癌症研究、药物研发、核聚变、特殊材料、超高效引擎和恒星爆炸。这台机器的目标是将完成这类工作所需的时间从几周缩短到几个小时,从几个小时缩短到几秒。

“Frontier可帮助科学家们开展更多的科学研究,这意味着更接近高效清洁能源,更快发现有效的病毒疫苗。”麦克雷迪说,“Frontier成为首个百亿亿次级计算机,这是我们整个征途的开始。看到美国橡树岭国家实验室的研究人员致力于解决气候、能源和疫情方面的问题,以及人类面临的其他重大挑战,我们已经从制造一台强大的计算机走向想要制造一些对每个人都有帮助的东西。”

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5438

    浏览量

    133918
  • 计算机
    +关注

    关注

    19

    文章

    7412

    浏览量

    87693
  • 超级计算机
    +关注

    关注

    2

    文章

    460

    浏览量

    41919

原文标题:首台百亿亿次计算机内部的秘密

文章出处:【微信号:bdtdsj,微信公众号:中科院半导体所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    工业计算机类型介绍

    ,各行各业80%的企业依靠计算机进行日常运营,使其成为成功不可或缺的工具。从小型企业到大型企业计算机已成为工业领域的支柱,推动着增长并推动
    的头像 发表于 11-04 15:56 147次阅读
    工业<b class='flag-5'>计算机</b>类型<b class='flag-5'>介绍</b>

    丹麦推出首台AI超级计算机Gefion

    近日,丹麦正式推出了该国首台人工智能超级计算机,命名为Gefion,以纪念丹麦神话中的女神。此次揭幕仪式由英伟达首席执行官黄仁勋与丹麦国王共同出席,彰显了该项目的重要性和影响力。 Gefion AI
    的头像 发表于 10-29 15:13 338次阅读

    NVIDIA助力丹麦发布首台AI超级计算机

    这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设,是一台 NVIDIA DGX SuperPOD 超级计算机
    的头像 发表于 10-27 09:42 383次阅读

    云端超级计算机怎么用

    云端超级计算机是一种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在一起,通过网络向用户提供按需的
    的头像 发表于 10-18 10:14 107次阅读

    借助NVIDIA超级计算机加速量子计算发展

    科学期刊《自然》(Nature)本月早些时候发表了一项研究,通过使用 NVIDIA 驱动的超级计算机,验证了量子计算的商业化途径。
    的头像 发表于 07-25 09:55 485次阅读

    AMD雄心勃勃:计划构建百万级GPU超级计算机集群

    在全球科技竞赛的舞台上,AMD近日宣布了一项令人瞩目的计划——打造一个包含多达120万颗GPU的超级计算机集群。这一宏大的举措立即引发了业界的广泛关注,许多人认为,这是AMD为了与英伟
    的头像 发表于 06-27 14:37 618次阅读

    工业计算机与普通计算机的区别

    在信息化和自动化日益发展的今天,计算机已经成为了我们日常生活和工作中不可或缺的工具。然而,在计算机领域中,工业计算机和普通计算机虽然都具备基本的计算
    的头像 发表于 06-06 16:45 1187次阅读

    本源超导量子计算机自主制造链11类产品系列之十:中国首套量子计算机应用软件与解决方案

    使用。中国首套量子计算机应用软件与解决方案本源量子着力打造量子计算生态联盟,推出中国首套量子计算机应用软件与解决方案,为生产制造上下游企业
    的头像 发表于 06-06 08:22 404次阅读
    本源超导量子<b class='flag-5'>计算机</b>自主<b class='flag-5'>制造</b>链11类产品系列之十:中国首套量子<b class='flag-5'>计算机</b>应用软件与解决方案

    富士通使用富岳超级计算机训练LLM

    尽管富士通的富岳超级计算机不再是超级计算机500强名单中最快的机器,但它仍然是一个非常强大的系统,A64FX处理器的多功能性允许将其用于各种工作负载,例如AI。
    的头像 发表于 05-13 14:18 510次阅读

    从原子到超级计算机:NVIDIA与合作伙伴扩展量子计算应用

    量子计算领域的最新进展包括分子研究、部署巨型超级计算机,以及通过一项新的学术计划培养量子从业人员。
    的头像 发表于 03-22 10:05 392次阅读

    诺和诺德基金会将联手英伟达打造丹麦AI超级计算机

    诺和诺德基金会携手英伟达,共同宣布在丹麦打造一台领先的AI超级计算机。这台超级计算机将致力于推动医疗保健、生命科学以及绿色转型等领域的科研与创新,为丹麦乃至全球的诺和诺德基金会携手英伟
    的头像 发表于 03-21 13:43 555次阅读

    【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

    介绍了量子计算机的工作原理、计算能力、研发现状等专业知识点;第二部分介绍了量子计算机的应用场景,比如工厂、物流、智慧交通、自动驾驶等等;正
    发表于 03-05 17:37

    国产计算机平台介绍——龙芯

    你了解中国的自主平台的计算机吗?不仅是中国制造,而是由中国自主研发,可以持续迭代产品,而且还能够决定产品用途、决定技术归属权的国产计算机才是真正中国计算机。 而作为中国
    的头像 发表于 03-05 11:40 725次阅读
    国产<b class='flag-5'>计算机</b>平台<b class='flag-5'>介绍</b>——龙芯

    英伟达与Equinix合作为企业客户提供超级计算机系统

    近日,数据中心运营商Equinix与芯片巨头英伟达宣布达成一项重要合作。双方将共同为企业客户提供英伟达的超级计算机系统,使企业能够更轻松地拥有并控制自己的AI
    的头像 发表于 01-29 11:20 691次阅读

    特斯拉在布法罗超级工厂投资5亿美元建造Dojo超级计算机

    霍楚尔表示,此次项目投资为5亿美元,并将同时在纽约州立大学建设另一台独立的AI超级计算机。“我很荣幸地告诉大家,特斯拉将在布法罗投资5亿美元,用于其新一代超级计算机的建设”,她说道。
    的头像 发表于 01-29 10:58 384次阅读