独家解读NVIDIA CUDA支持Arm——百万兆级超算竞争再加剧？-电子发烧友网

在法兰克福举办的全球超级计算大会上，重磅消息传来，NVIDIA宣布CUDA支持Arm CPU，为高性能计算开辟全新途径，以构建具有极高能效水平的百万兆级AI超级计算机。北京时间6月17日下午四点，NVIDIA与媒体召开电话会议。下文将详解双方合作始末，以及<电子发烧友>独家求证后获知的信息。

NVIDIA携手Arm意欲何在？

随着传统计算规模扩展步伐的停止，功率将成为所有超级计算机的限制因素。对于与Arm的携手，NVIDIA创始人兼首席执行官黄仁勋表示：“NVIDIA CUDA加速的计算和Arm的高能效CPU架构的相结合，将助力HPC社区实现大幅提升，以达到百万兆级。”

双方合作的原因主要有两方面：首先，客户需要更多选择，一旦完成堆栈优化，Nvidia将加速所有主要CPU架构，包括x86、Power和ARM；其次，通过将NVIDIA软件栈引入Arm生态系统，将进一步助推在HPC服务器市场的创新。

年底前，NVIDIA将向Arm生态系统提供全堆栈的AI和HPC软件，该堆栈为600多个HPC应用程序和所有AI框架提供加速，其中包括了所有NVIDIA CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具，如支持OpenACC的PGI编译器和性能分析器。

NVIDIA解决方案架构与工程团队副总裁Marc Hamilton透露，NVIDIA和Arm已为这个计划准备了两年左右，认为现在是最佳的发布时机。建立在双方超过10年的合作基础之上，此前，NVIDIA几款用于便携式游戏、自动驾驶汽车、机器人和嵌入式AI计算的系统级芯片产品都采用了Arm。全球众多涉及超级计算的项目或单位都在寻求Arm的加入，包括欧洲处理器计划（European Processor Initiative）、日本先进情报项目中心 (RIKEN)、美国能源部的先锋项目（DOE Vanguard project）等。

合作仅止于HPC软件方面？还是会进一步影响到某些应用市场？NVIDIA表示，合作同时也是对于其他平台的补充，例如Jetson Xavier，并将进一步拓展在数据中心和HPC平台的合作。

超算竞争再加剧

在超级计算机中使用基于Arm的体系结构是值得注意的，和其他架构相比，Arm的一大特色在于出色的能效，能够为超级计算提供开放式架构，用户可以实现更为高度的集成。对于需要快速处理和分析大型数据集的研究密集型任务，能够满足内存容量和可扩展性需求。

Arm已经在世界各地的许多HPC中心获得了越来越多的关注，NVIDIA支持Arm CPU后，将为研发超算的研究人员们提供了除英特尔和IBM外的第三种选择，并使得研发者可以通过这种方式获得更多的自主控制能力。对于已经选择了Arm CPU的用户来说，他们同时可以获得NVIDIA GPU加速计算选项。CUDA强大的软件能力，将能够和Arm的软件生态无缝衔接，强强联合。

一直以来，Arm并没有放弃将其处理器扩展至高性能计算领域的坚持。近年来大的举动有：2016年8月宣布将与日本富士通公司合作，开发一个以64位ARMv8-A驱动的Post K超级计算机，并于当年12月宣布收购Allinea Software公司，后者主要为超级计算机提供性能分析工具。在2018年11月的TOP500列表上，首次出现了Arm的身影，而且是安装在大名鼎鼎的美国桑迪亚国家实验室。与此同时，Cray于2018年11月在英国气象局交付了一台基于Arm的超级计算机"Isambard"，而日本的下一代超级计算机"Post-K"也同样基于Arm架构。

超算未来将更为注重能耗

超算届有两个重要排名：TOP500和Green500。TOP500主要按照性能基准，提供通用高端应用的系统排名。而相比TOP500，Green500除了追求运算速度，更加重视超算的能耗问题。

根据今年刚刚发布的Green500排行榜，在全球最节能的25款超级计算机中，有22款都得益于NVIDIA的支持。关键因素在于：采用NVIDIA GPU的超级计算机能够将繁重的处理作业卸载至更为节能的并行处理CUDA GPU之上；NVIDIA与Mellanox合作优化整体超级计算集群的处理；以及NVIDIA发明的SXM 3D封装和可实现极密集型扩展节点的NVIDIA NVLink互连技术。

携手打造超豪华“朋友圈”

包括超算中心和系统提供商以及系统级芯片制造商等在内的众多HPC行业及Arm生态系统中的全球领先企业，都表达了其对于NVIDIA携手Arm的支持。

对于超算百万兆级时代的愿景，Cray认为主要在于将AI和分析与建模、仿真相结合的系统，这些系统能够支持、也经常需要为科学、工程和数字化转型所需的数据密集型工作负载构建的多种处理器架构和系统。Cray系统管理和编程环境（编译器、库和工具）已经能够在XC和未来的Shasta超级计算机上支持Arm处理器，将CUDA和CUDA-X HPC和AI软件堆栈用于Arm平台，并将其与Cray系统管理和编程环境紧密集成，能够助力其超级计算机实现最终愿景。

“欧洲处理器计划（European Processor Initiative，EPI）总经理Philippe Notton则表示，打造欧盟自己的高端、低功耗、通用和加速器解决方案，EPI和其工业合作伙伴SiPearl非常看好NVIDIA所带来的全新可能性。将EPI基于Arm的微处理器与NVIDIA加速器相结合，能够匹配未来欧洲百万兆级模块化超级计算机中的构建模块。”

考虑到未来几年内百万兆级系统和大规模AI计算的兴起，Jülich超算中心负责人Thomas Lippert表示， NVIDIA对Arm处理器的支持是非常令人兴奋的发展，对于实现未来超级计算机和可组合数据中心的真正模块化至关重要。

在HPC网络方面处于领先地位的Mellanox Technologies，其InfiniBand和以太网技术连接了全球多款大型的超级计算机，其中就包括第一代基于Arm的各系统。该公司创始人兼首席执行官Eyal Waldman希望通过持续合作，部署200Gb/s HDR和计算网络技术，以优化HPC和AI工作负载，并实现新一代基于Arm的超级计算机的超级连接。

百万兆级意义何在？

全球超级计算机竞赛正朝着“百万兆级计算”这个里程碑似的目标前进着。

百万兆级意味着什么？一个百万兆级的计算机一瞬间进行的计算量，相当于地球上所有人每天每秒都不停地计算四年。

这种非凡的力量将使研究人员能够进行大规模复杂的模拟，从而在许多领域取得进展，从气候科学到基因组学、可再生能源和人工智能。田纳西大学的超级计算机专家Jack Dongarra曾说过：“百万兆级的计算机是一项有力的科学工具，就像粒子对撞机或巨型望远镜一样。”这些机器在工业上也很有用，它们可以被用于加速产品设计和识别新材料。军方和情报机构也渴望这样的超级计算机能够将被用于维护国家安全。超级计算机是促进科学发现的重要工具，建立百万兆级超级计算将能够极大地扩展人类知识的边界。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

ARM

ARM

+关注

关注
134

文章
9189

浏览量
370079
NVIDIA

NVIDIA

+关注

关注
14

文章
5093

浏览量
104023
超级计算

超级计算

+关注

关注
1

文章
39

浏览量
11320
HPC

HPC

+关注

关注
0

文章
327

浏览量
23893
CUDA

CUDA

+关注

关注
0

文章
121

浏览量
13731

NVIDIA发布个人超算利器project digital，标志着ai元年的开启

的projectdigital发布之后，这些设想都在被世人一一实现。NVIDIA发布的最新个人超算projectdigital将云AI转变成了本地AI，通过强大的硬件解

发表于 01-16 11:52 •314次阅读

<b class='flag-5'>NVIDIA</b>发布个人<b class='flag-5'>超</b><b class='flag-5'>算</b>利器project digital，标志着ai元年的开启

NVIDIA加速全球大多数超级计算机推动科技进步

HPCwire 读者和编辑选择奖。自 2006 年发布 CUDA 以来，NVIDIA 不断推动 AI 和加速计算的进步，最新发布的全球最强超级计算机 TOP500 榜单突显了该公司在超算

发表于 11-24 14:38 •414次阅读

iQOO 13首发电竞芯片Q2,独家支持2K分辨率

10月23日，iQOO正式揭晓，其最新款iQOO 13将独家首发自研电竞芯片Q2，此举突破了电竞视效的极限，树立了新的行业标杆。　　凭借Q2芯片的卓越性能，iQOO 13实现了行业前所未有的2K 144FPS超分超帧并发

发表于 10-24 11:43 •1245次阅读

ARMxy工业控制器为视频监控提供1Tops算力支持

ARMxy ARM工业控制器以其1Tops的算力NPU，在视频监控中的应用展现出了不错的性能和广泛的应用，为用户提供了高效、稳定和可靠的解决方案，一起看看它的具体应用吧。一、ARMxy ARM工业

发表于 08-20 12:03 •428次阅读

预定下代超算第一？富士通144核Arm处理器公开

电子发烧友网报道（文/周凯扬）相信对超算市场有过一定了解的朋友，都对曾经的第一名富岳超算不陌生。这台2021年正式启用的超

发表于 06-24 00:26 •2937次阅读

鸿海再获AI领域大单，独家供货英伟达GB200 NVLink交换器

在人工智能（AI）领域的激烈竞争中，鸿海集团再次传来捷报。继成功获得英伟达（NVIDIA）GB200 AI服务器代工订单的大份额后，鸿海又独家揽获了GB200关键元件——被誉为“提升算

发表于 06-19 15:04 •1109次阅读

NVIDIA 通过 Holoscan 为 NVIDIA IGX 提供企业软件支持

Enterprise-IGX软件现已在NVIDIA IGX平台上正式可用，以满足工业边缘对实时 AI 计算日益增长的需求。它们将共同帮助医疗、工业和科学计算领域的解决方案提供商利用企业级软件和支持来加快开发

发表于 06-04 10:21 •585次阅读

QPU与GPU，经典超算和量子计算的协同

电子发烧友网报道（文/李宁远）不久前在国际超算大会ISC上， NVIDIA宣布将通过开源的 NVIDIA CUDA-Q量子计算平台，助力全球

发表于 05-21 01:35 •2702次阅读

英伟达CUDA-Q平台推动全球量子计算研究

与经典超算的深度整合。该平台的重要特性在于其支持量子计算与AI人工智能的完美结合，为解决量子比特噪声问题提供了新思路，并有助于开发出更加高效的算法。

发表于 05-14 11:45 •737次阅读

最新Top500超算榜单公布：Frontier再夺魁首，Aurora破百亿大关

此次Top500排行榜中只有一个显著变动：瑞士国家超级计算机中心的Alps超算凭借270 PFlop/s的Rmax LINPACK FP64算力排名上升至第六，超过了IBM POWER9处理器和

发表于 05-14 09:36 •921次阅读

NVIDIA通过CUDA-Q平台为全球各地的量子计算中心提供加速

德国、日本和波兰的超级计算机利用 Grace-Hopper 和量子-经典加速超算平台推进量子计算研究。

发表于 05-14 09:15 •432次阅读

NVIDIA 通过 CUDA-Q 平台为全球各地的量子计算中心提供加速

—— NVIDIA 于今日宣布将通过开源的 NVIDIA CUDA-Q™ 量子计算平台，助力全球各地的国家级超

发表于 05-13 15:21 •243次阅读

宁德时代、比亚迪正向新能源车细分领域探索，推进百万级车型电动化

宁德时代和比亚迪正默契地向新能源车细分领域探索，越野、超跑等百万级车型的高端市场逐渐成为他们提高市占率的新“战场”。

发表于 04-19 10:39 •1070次阅读

“捷智算”正式入驻国家超算互联网平台

ABSTRACT摘要2024年4月2日，本公司旗下算力服务品牌“捷智算”正式入驻国家超算互联网平台，开设云gpu旗舰店。我们将借助国家超

发表于 04-12 08:26 •789次阅读

深度解读Nvidia AI芯片路线图

Nvidia是一个同时拥有 GPU、CPU和DPU的计算芯片和系统公司。Nvidia通过NVLink、NVSwitch和NVLink C2C技术将CPU、GPU进行灵活连接组合形成统一的硬件架构，并于CUDA一起形成完整的软硬件

发表于 03-13 09:25 •1123次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

独家解读NVIDIA CUDA支持Arm——百万兆级超算竞争再加剧？

NVIDIA携手Arm意欲何在？

超算竞争再加剧

超算未来将更为注重能耗

携手打造超豪华“朋友圈”

百万兆级意义何在？

评论

NVIDIA发布个人超算利器project digital，标志着ai元年的开启

NVIDIA加速全球大多数超级计算机推动科技进步

iQOO 13首发电竞芯片Q2,独家支持2K分辨率

ARMxy工业控制器为视频监控提供1Tops算力支持

预定下代超算第一？富士通144核Arm处理器公开

鸿海再获AI领域大单，独家供货英伟达GB200 NVLink交换器

NVIDIA 通过 Holoscan 为 NVIDIA IGX 提供企业软件支持

QPU与GPU，经典超算和量子计算的协同

英伟达CUDA-Q平台推动全球量子计算研究

最新Top500超算榜单公布：Frontier再夺魁首，Aurora破百亿大关

NVIDIA通过CUDA-Q平台为全球各地的量子计算中心提供加速

NVIDIA 通过 CUDA-Q 平台为全球各地的量子计算中心提供加速

宁德时代、比亚迪正向新能源车细分领域探索，推进百万级车型电动化

“捷智算”正式入驻国家超算互联网平台

深度解读Nvidia AI芯片路线图