0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

利用AMD本能加速器将HPC的可持续性提升到一个新的水平

星星科技指导员 来源:AMD 作者:AMD 2023-06-27 09:30 次阅读

高性能计算 (HPC) 已成为我们现代世界的重要组成部分,执行对科学研究、工程、安全和其他领域至关重要的复杂模拟和计算。然而,随着对HPC的需求不断增长,通常是在超级计算机和大型数据中心,对其环境影响的担忧也在增加。近年来,鉴于对总拥有成本和气候问题的影响,人们越来越关注数据中心的可持续性。在这篇博文中,我们将探讨有关数据中心能效的一些关键问题,并讨论 AMD 帮助减少 HPC 对环境的影响的一些策略。

数据中心面临的最大挑战之一是当您扩展到百万兆次级及更高规模时,它们的能耗。服务器节点消耗大量能量,HPC 需要更多能量,其所有 CPU 和加速器,这使得提高效率成为重要优先事项。随着对 HPC 计算需求的不断增加,我们遇到了能耗是一个门控因素的情况。这种能源消耗不仅给环境带来了压力,也给数据中心运营商的底线带来了压力,因为行业需要更多的计算性能。因此,随着行业迈向下一个里程碑,需要大幅提高每瓦性能。

由于 AMD 是尖端服务器 CPU 和 GPU 的设计者,我们认识到我们在解决这些关键优先事项方面的重要作用。我们专注于提高服务器能效,降低数据中心总拥有成本 (TCO),并提供高性能计算 (HPC),以帮助应对世界上一些最严峻的挑战。早在 2021 年 2 月,AMD 就宣布了一个雄心勃勃的目标,即提高运行处理器的能效......要实现这一目标,AMD 需要以比过去五年中全行业总体改进快 5.<> 倍以上的速度提高计算节点的能效。

AMD Instinct™ 加速器通过在设备和系统级别提供卓越的每瓦性能,从而实现高能效的 HPC 和 AI,从而提高计算的能效。要实现 AMD HPC 和 AI 能效目标,需要围绕架构、内存和互连进行更高水平的思考,这些架构、内存和互连相结合,可加速系统级改进。对于我们的 AMD Instinct MI200 系列加速器,我们从多方面的角度看待它,我们将在下面更详细地解释一些关键技术,以实现每瓦特和效率的领先性能。

架构技术 – MI2 系列中的 AMD CDNA™ 200 架构通过增强面向 HPC 和 AI 的矩阵核心技术,推动双精度浮点数据和各种矩阵乘法基元的计算能力,代表了与上一代产品相比的重大飞跃。一个特别强调的是使用FP64矩阵和矢量数据的科学计算,以便在橡树岭国家实验室前沿超级计算机等大型系统中扩展时实现百万兆次级的性能,性能为1.1 exaflops。与上一代 MI4 CDNA 架构相比,这些改进使 FP64 矢量 TFLOP/s 和 2.5 倍 FP64 TFLOPS/瓦特相应提高了 100 倍,从而提高了每瓦性能。

wKgZomSaPYyAB2u1AABOC6irWTA068.png

封装技术 – 芯片和先进的封装技术是提高性能和整体效率的巨大杠杆。它们允许您将不同的技术用于不同的功能,组合多个加速器芯片,并使加速器更接近内存等。互连密度越密集,解决方案的效率就越高,并有助于降低昂贵的数据传输能耗。

MCM - 全球首款多芯片 GPU,旨在通过单个封装最大限度地提高计算和数据吞吐量。MI250 和 MI250X 在单个封装中使用两个 AMD CDNA 2 图形内核芯片 (GCD),在高度精简的封装中提供 58 亿个晶体管,与 AMD 上一代加速器相比,内核数量增加了 1.8 倍,内存带宽提高了 2.6 倍 。两个GCD通过高速接口连接在一起,用于芯片到芯片的通信

高架扇出桥 – 将 AMD CDNA 芯片连接到基板上各自的 HBM2E 内存堆栈,这可以降低复杂性并提高可扩展性,同时降低成本。传统上,硅中介层部署有微凸块以支持高密度互连。这种方法需要一个大的硅衬底来支撑上面的整个硅加HBM组件。

通信技术 – 在开发高性能计算机时,通信是处理大量数据的关键。在处理器和外部世界之间高效移动数据的能力对于向上和向外扩展的系统性能也至关重要。将硅芯片在物理和电气上更紧密地结合在一起,可以大大降低通信能量,同时提供更高的吞吐量潜力。AMD Infinity 架构是我们在 CPU 和 GPU 以及 GPU 到 GPU 之间的高速通信高速公路,我们将在加速器中讨论提高通信效率的两个领域。

芯片到芯片互连 - 封装内 AMD 无限结构™接口是 AMD CDNA 2 系列的关键创新之一,可连接 MI2 或 MI250X 中的 250 个 GCD。它利用封装内 GCD 之间的极短距离,以 25 Gbps 和极低的功耗运行,在 GCD 之间提供高达 400 GB/s 的理论最大双向带宽。

Infinity Architecture – 最新的 AMD Instinct 产品使用我们的第 3 代 Infinity Fabric,与上一代产品相比有了显著的改进。MI200 系列为 AMD Instinct™ MI8(或 MI2X)加速器上的 GPU P250P 或 I/O 提供多达 250 个外部无限结构™链路,提供高达 800 GB/s 的总理论带宽,提供高达 235% 的 GPU P2P(或 I/O)理论带宽性能,是上一代产品 (3)。

结论
如今,AMD 使用我们当前的 EPYC(霄龙)和本能处理器和加速器为一些最高效的超级计算机提供支持。Green500 是超级计算机的行业排名,每年两次通过测量每瓦性能按能效排名。AMD 在最新的 2 年 7 月 Green2023 名单上保持着 #500 到 #<> 的位置,这证明了 AMD CPU 和 GPU 技术不仅提供了一些最强大的超级计算机,而且还提供了名单上一些最节能的超级计算机。

为了推动Zetascale的未来计算里程碑,需要围绕架构、内存和互连进行更高水平的思考,这些架构、内存和互连相结合,以加速系统级改进。AMD 已经迈出了第一步,将关键部分组合成一个新的加速器,其中包括最好的 AMD EPYC(霄龙)™ CPU 和 AMD 本能™加速器,旨在实现比之前的 MI250 设计更高的代际效率和性能提升。这款名为 MI300 的全新 AMD Instinct 加速器将成为全球首款结合 CPU + GPU + 共享 HBM 的集成数据中心 APU,并提供突破性的架构,为未来的百万兆次级 AI 和 HPC 超级计算机提供动力。正是 MI300 上的单片集成利用了刚才讨论的所有方法,实现了比之前的 MI250 设计更大的代际效率提升。

总之,长期提高计算机能效对于降低运营成本和推进高性能计算机、超级计算机和数据中心的可持续发展目标非常重要。AMD Instinct 团队致力于解决设备和系统级别的每瓦性能问题,从而提高计算效率并推进数据中心对 HPC 和 AI 的可持续性。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10876

    浏览量

    212121
  • 加速器
    +关注

    关注

    2

    文章

    802

    浏览量

    37928
  • 服务器
    +关注

    关注

    12

    文章

    9222

    浏览量

    85603
收藏 人收藏

    评论

    相关推荐

    玩游戏能减少延时,超级QQ登陆IP隐藏软件 智雨网络加速器

    加速器可以您家里的宽带网络质量提升到全新的档次,说句带点玩笑性质但又是实情的话:“您正在使用的宽带网络质量越糟糕,我们软件带给您帮助就
    发表于 05-07 16:50

    由采购员提升到采购工程师的四大诀窍

    本帖最后由 maskmyself 于 2016-4-15 15:14 编辑 如何从小小的采购员提升到经验老道的采购工程师除了
    发表于 05-16 20:06

    可持续性运营放在最前线

    这些可持续性项目是安森美半导体企业社会责任活动的重要环。每年,我们都会跟踪150多个以减少碳排放、降低能耗、节水、减少使用化学品和减少废物产生为目标的项目。安森美半导体的企业社会责任大部分建基于我
    发表于 10-26 08:53

    如何进行电流检测放大器使用,以达到电压提升到可用水平

    如何进行放大器设计和使用,以将它们之间产生的电压提升到可用水平?通常两端小电压通常从数十或数百毫伏增加到零点几伏,通过在电流检测放大器分流作用下,能否得到很大提升,带集成增益设定电阻
    发表于 01-10 15:06

    如何DSP性能提升到极限?

    如何DSP性能提升到极限?FPGA用做数字信号处理应用
    发表于 04-30 06:34

    使用AMD-Xilinx FPGA设计AI加速器通道

    介绍使用 AMD-Xilinx FPGA设计全连接DNN核心现在比较容易(Vitis AI),但是利用这个核心在 DNN 计算中使用它是另
    发表于 02-21 15:01

    英飞凌稳居全球最具可持续性公司行列 再度入选《可持续性年鉴》

    英飞凌已连续四年被瑞士投资公司 RobecoSAM 列入知名的《可持续性年鉴》。由此,德国半导体制造商英飞凌再次跻身全球最具可持续性公司行列。
    发表于 02-10 17:45 605次阅读

    手机 UL 110 可持续性标准认证被 EPEAT 认证系统采用

    日前,UL环境部和EPEAT认证系统管理者——绿色电子委员会(GEC)共同宣布,手机的可持续性认证标准ANSI(美国国家标准学会)/ UL 110被EPEAT(电子产品环境影响评估工具)认证系统采用,成为全球公共和私人集团采购商用于识别和购买可持续性IT产品的标准。
    发表于 03-09 13:22 5847次阅读

    利用以下八开源AI技术,你的机器学习项目可提升到水平

    人工智能(AI)技术正迅速改变我们生活中几乎每一个领域。从我们如何交流到,用于交通的手段,我们似乎越来越沉迷于人工智能。由于AI快速发展,大量的人才和资源致力于加速技术的发展。利用以下最好的开源AI技术,可将你的机器学习项目
    发表于 05-16 14:14 1954次阅读

    欧司朗的Oslon为新概念提升了HX 驾驶员辅助系统提升到新的水平

    Oslon Boost HX非常适合用于DMD系统,因为它可提供出色的亮度,基于光的驾驶员辅助系统提升到新的水平
    的头像 发表于 10-12 14:39 5561次阅读

    如何利用物联网工业自动化提升到新的水平

    (IIOT)使制造系统能够“感知”和“思考”流程中的变化,并对紧急情况下的变化做出“反应”,因此,物联网的引入将自动化制造系统的性能和功能提升到全新的水平
    发表于 06-12 16:01 1467次阅读

    AMD宣布推出全新AMD Instinct MI200系列加速器

      — AMD Instinct MI200系列加速器凭借全新AMD CDNA 2架构,在HPC性能方面可提供极具突破
    的头像 发表于 11-16 10:04 2682次阅读
    <b class='flag-5'>AMD</b>宣布推出全新<b class='flag-5'>AMD</b> Instinct MI200系列<b class='flag-5'>加速器</b>

    利用NVIDIA BlueField DPU加速计算提升到新的水平

    全球的超级计算中心都在纷纷利用 NVIDIA Quantum InfiniBand 网络上的 NVIDIA BlueField DPU 加速计算提升到
    的头像 发表于 06-01 10:29 1234次阅读

    互连解决方案的可持续性发展

    以下几个主要市场正推动着可持续性互连解决方案的发展
    的头像 发表于 11-20 15:14 140次阅读
    互连解决方案的<b class='flag-5'>可持续性</b>发展

    IBM与AMD携手部署MI300X加速器,强化AI与HPC能力

    近日,据外媒最新报道,国际商业机器公司(IBM)与超威半导体公司(AMD)已正式宣布达成项重要合作。双方携手在IBM Cloud上部署AMD的Instinct MI300X
    的头像 发表于 11-21 11:07 250次阅读