全球最快超级计算机正在发生飞速的变化-电子发烧友网

随着最新一代超级计算机日益与人工智能和云计算相结合，衡量这些机器的方式也在发生变化。

从科学模拟、可视化、数据分析再到机器学习，各种现代计算的工作负载正在推动超级计算中心、云服务提供商和企业重新思考他们的计算架构。仅靠处理器、网络或软件优化已经无法满足研究人员、工程师和数据科学家的最新需求。

数据中心取而代之，成为新的计算单元，因此企业必须关注整个技术堆栈。全球最强系统的最新排名显示，在新一代超级计算机中，这种使用全栈方法的趋势还在持续。在本周SC21高性能计算大会上最新发布的TOP500榜单上，NVIDIA技术为355套超级计算机系统提供加速，占榜单的70%以上，而新增系统中90% 以上都采用了NVIDIA 的技术。

对比6月份发布的TOP500榜单上342个系统（占榜单68%）使用NVIDIA技术，增长趋势明显。 NVIDIA在全球最节能系统Green500榜单上也继续保持领先优势，占据了榜单排名前25名系统中的23套，与6月份持平。平均来看，采用NVIDIA GPU的系统能耗效率比非GPU系统高3.5倍。

来自微软的GPU加速Azure超级计算机在榜单上排名第十。这是基于云的系统首次跻身前10名，新一代云原生系统就此崭露头角。人工智能正带来一场科学计算的革命。近年来，研究高性能计算和机器学习的论文数量激增，从2018年的约600篇增长到2020年的近5000篇。

包括HPL-AI和MLPerf HPC在内的新基准也强调了高性能计算和AI工作负载的持续融合。作为一个融合了高性能计算和人工智能工作负载的新基准，HPL-AI使用了深度学习和许多科学与商业工作的基础——混合精度计算，同时还提供高性能计算基准传统的标准标尺——双精度计算的高度准确性。 MLPerf HPC基准适用于通过人工智能实现超级计算机模拟加速和增强的计算方式，主要被用来测试高性能计算中心天体物理学（Cosmoflow）、天气（Deepcam）和分子动力学（Opencatalyst）三大关键工作负载的性能表现。 NVIDIA通过GPU加速处理、智能网络、GPU优化应用程序和支持AI和高性能计算融合的库来解决整个堆栈的问题。这一方法提升了工作负载的性能表现，并推动了科学突破。让我们来具体看一看NVIDIA是如何助力超级计算机实现性能提升的。

加速计算

GPU的并行处理能力再加上超过2500个GPU优化应用程序，在多数情况下可以让用户把高性能计算任务的时间从几周减少到几个小时。

NVIDIA一直在优化CUDA-X库和GPU加速应用程序，所以用户如果发现自己的GPU架构性能突然有了提升也很正常。因此，应用范围最广的科学应用程序（我们称之为“黄金套件”）的性能在过去6年里提高了16倍，而且还在不断提升。

为帮助用户快速提升性能，NVIDIA通过NGC目录中的容器提供最新版本的人工智能和高性能计算软件。用户只需在数据中心或云端的超级计算机上拖拽并运行应用程序即可。

高性能计算与人工智能融合

人工智能在高性能计算中的应用能帮助研究人员加快模拟速度，同时保持传统模拟方法的准确性。为此，越来越多的研究人员开始利用人工智能来加快研究的速度，比如今年超算领域最有声望的戈登·贝尔奖（GordonBell prize）决赛的四组晋级团队。各大企业正在竞相建造E级人工智能计算机，以支持这种融合高性能计算和人工智能的新模式。一些相对较新的基准（如HPL-AI和MLPerf HPC）也印证了这一趋势，强调了高性能计算和AI工作负载的持续融合。为推动这一趋势，上周NVIDIA推出了一系列用于高性能计算的先进的新的库和软件开发工具套件。图是现代数据科学中的一个关键数据结构。通过一个名为深度图库（DGL）的新型Python包，用户现在可以把图投影到深度神经网络框架中。

NVIDIA Modulus构建并训练了一个内嵌物理信息的机器学习模型，可以用来学习并遵循物理定律。 NVIDIA推出了三个新库：

ReOpt – 可提高规模高达10万亿美元的物流行业的运营效率。

cuQuantum – 可加速量子计算研究。

cuNumeric – 为Python社区的科学家、数据科学家、机器学习和人工智能研究人员加速NumPy。

NVIDIA的虚拟世界模拟和3D工作流协作平台NVIDIA Omniverse负责把一切整合到一起。

Omniverse可用来模拟仓库、工厂、物理和生物系统、5G边缘、机器人、自动驾驶汽车甚至是虚拟形象的数字孪生。

NVIDIA上周宣布，将利用Omniverse构建一台名为Earth-2的超级计算机，通过创建一个数字孪生地球来预测气候变化。

云原生超级计算

随着超级计算机在数据分析、人工智能、模拟和可视化方面承担越来越多的工作负载，CPU不得不在大型复杂的系统上支持更多的通信任务。 DPU（数据处理器）可以卸载多种操作，有效减轻这一压力。作为一个完全集成的片上数据中心平台，NVIDIA BlueField DPU可以卸载和管理数据中心的基础设施任务，释放主机的处理器资源，从而实现更强的安全性和更高效的超级计算编排工作。与NVIDIA Quantum InfiniBand平台相结合，该架构可提供最佳裸机性能，同时原生支持多节点租户隔离。

NVIDIA的Quantum InfiniBand平台提供可预测的裸机性能隔离。并且采用零信任安全防护，因而这些新系统也更加安全。

BlueField DPU将用户应用与基础设施任务隔离开来。最新的BlueField软件平台NVIDIA DOCA 1.2支持下一代分布式防火墙和更广泛的线速数据加密。而NVIDIA Morpheus则会假设入侵者已经进入数据中心，将利用基于深度学习的数据科学来实时检测入侵者的活动。新的网络技术则会加速上述这些趋势场景。上周NVIDIA还发布了NVIDIA Quantum-2。这是一个400Gbps InfiniBand平台，由Quantum-2交换机、ConnectX-7网卡、BlueField-3DPU以及用于新网络架构的软件组成。 NVIDIA Quantum-2提供了裸机高性能和安全多租户优势，可以让下一代超级计算机实现安全性、云原生以及更高的效率。

编辑：jq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

计算机

计算机

+关注

关注
19

文章
7409

浏览量
87691
网卡

网卡

+关注

关注
3

文章
302

浏览量
27335
交换机

交换机

+关注

关注
21

文章
2621

浏览量
99219
数据中心

数据中心

+关注

关注
16

文章
4668

浏览量
71938

原文标题：SC21 | 全球最快超级计算机正飞速发生变化

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

市的 Colossus 超级计算机集群达到了 10 万颗 NVIDIA® Hopper GPU 的巨大规模。该集群使用了 NVIDIA Spectrum-X™ 以太网网络平台，该平台是专为多租户

发表于 10-30 09:33 •117次阅读

NVIDIA 以太网加速 xAI 构建的<b class='flag-5'>全球</b>最大 AI <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

丹麦推出首台AI超级计算机Gefion

近日，丹麦正式推出了该国首台人工智能超级计算机，命名为Gefion，以纪念丹麦神话中的女神。此次揭幕仪式由英伟达首席执行官黄仁勋与丹麦国王共同出席，彰显了该项目的重要性和影响力。 Gefion AI

发表于 10-29 15:13 •338次阅读

NVIDIA助力丹麦发布首台AI超级计算机

这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设，是一台 NVIDIA DGX SuperPOD 超级计算机。

发表于 10-27 09:42 •383次阅读

云端超级计算机怎么用

云端超级计算机是一种基于云计算的高性能计算服务，它将大量计算资源和存储资源集中在一起，通过网络向用户提供按需的

发表于 10-18 10:14 •103次阅读

借助NVIDIA超级计算机加速量子计算发展

科学期刊《自然》（Nature）本月早些时候发表了一项研究，通过使用 NVIDIA 驱动的超级计算机，验证了量子计算的商业化途径。

发表于 07-25 09:55 •485次阅读

工业计算机与普通计算机的区别

在信息化和自动化日益发展的今天，计算机已经成为了我们日常生活和工作中不可或缺的工具。然而，在计算机领域中，工业计算机和普通计算机虽然都具备基本的计算

发表于 06-06 16:45 •1185次阅读

NVIDIA和Recursion利用AI超级计算机加快新药研发

BioHive 由 NVIDIA AI 驱动，用于加速医疗领域科学家的工作。在全球超级计算机 TOP500 榜单中，它的排名上升了 100 多位。

发表于 05-16 09:46 •1227次阅读

富士通使用富岳超级计算机训练LLM

尽管富士通的富岳超级计算机不再是超级计算机500强名单中最快的机器，但它仍然是一个非常强大的系统，A64FX处理器的多功能性允许将其用于各种

发表于 05-13 14:18 •510次阅读

英伟达帮助日本建造混合量子超级计算机

英伟达正在帮助日本建造混合量子超级计算机，这是日本国家量子计算计划的一部分。

发表于 04-23 14:54 •514次阅读

微软和OpenAI计划投资1000亿美元建造“星际之门”AI超级计算机

微软和OpenAI计划投资1000亿美元建造“星际之门”AI超级计算机这一消息属实。

发表于 04-11 10:14 •497次阅读

从原子到超级计算机：NVIDIA与合作伙伴扩展量子计算应用

量子计算领域的最新进展包括分子研究、部署巨型超级计算机，以及通过一项新的学术计划培养量子从业人员。

发表于 03-22 10:05 •389次阅读

诺和诺德基金会将联手英伟达打造丹麦AI超级计算机

诺和诺德基金会携手英伟达，共同宣布在丹麦打造一台领先的AI超级计算机。这台超级计算机将致力于推动医疗保健、生命科学以及绿色转型等领域的科研与创新，为丹麦乃至

发表于 03-21 13:43 •555次阅读

华为超百亿上海研发中心受到瞩目/英伟达公开最快AI超级计算机/格芯获15亿美元补贴科技新闻点评

在上海市发改委并不的2024年上海市重大工程列表，华为上海研发基地计划今年6月竣工交付。2月15日，Nvidia首度公开最新面向企业的超级计算机 Eos的架构，Eos是该公司速度最快的 AI

发表于 02-20 10:39 •2435次阅读

特斯拉在布法罗超级工厂投资5亿美元建造Dojo超级计算机

霍楚尔表示，此次项目投资为5亿美元，并将同时在纽约州立大学建设另一台独立的AI超级计算机。“我很荣幸地告诉大家，特斯拉将在布法罗投资5亿美元，用于其新一代超级计算机的建设”，她说道。

发表于 01-29 10:58 •384次阅读

亚马逊网络服务与英伟达联手打造AI超级计算机

亚马逊网络服务公司（Amazon Web Services）不久将拥有一台由英伟达（Nvidia）制造的新型超级计算机，该公司称这是世界上速度最快的人工智能系统之一。

发表于 01-11 11:06 •769次阅读

搜索历史

全球最快超级计算机正在发生飞速的变化

评论

NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

丹麦推出首台AI超级计算机Gefion

NVIDIA助力丹麦发布首台AI超级计算机

云端超级计算机怎么用

借助NVIDIA超级计算机加速量子计算发展

工业计算机与普通计算机的区别

NVIDIA和Recursion利用AI超级计算机加快新药研发

富士通使用富岳超级计算机训练LLM

英伟达帮助日本建造混合量子超级计算机

微软和OpenAI计划投资1000亿美元建造“星际之门”AI超级计算机

从原子到超级计算机：NVIDIA与合作伙伴扩展量子计算应用

诺和诺德基金会将联手英伟达打造丹麦AI超级计算机

华为超百亿上海研发中心受到瞩目/英伟达公开最快AI超级计算机/格芯获15亿美元补贴科技新闻点评

特斯拉在布法罗超级工厂投资5亿美元建造Dojo超级计算机

亚马逊网络服务与英伟达联手打造AI超级计算机