VIDIA宣布在AI超级计算平台中加入融合了AI与高性能计算的新技术-电子发烧友网

NVIDIA A100 80G PCIe、NVIDIA NDR 400G InfiniBand和NVIDIA Magnum IO三箭齐发！超强HGX助力广大HPC系统和云服务

NVIDIA宣布在NVIDIA HGX AI超级计算平台中加入融合了AI与高性能计算的新技术，使越来越多的行业能够更加充分地利用超级计算的力量。

为了加快产业AI和HPC新时代的到来，NVIDIA在HGX平台中加入了三项关键技术：NVIDIA A100 80GB PCIe GPU、NVIDIA NDR 400G InfiniBand网络和NVIDIA Magnum IO GPUDirect Storage软件。三者结合，提供了卓越的性能，以实现产业 HPC 的创新。

目前，已有数十家合作伙伴将NVIDIA HGX平台用于新一代系统和解决方案，其中包括源讯（Atos）、戴尔科技（Dell Technologies，）、慧与（Hewlett Packard Enterprise ）、联想（Lenovo）、Microsoft Azure以及NetApp等。

NVIDIA创始人兼首席执行官黄仁勋先生表示：“HPC 革命始于学术界，并迅速扩展到各行各业。产业各项关键趋势正在推动超指数、超摩尔定律的发展速度，使HPC变成各行业都能使用的工具。NVIDIA 的 HGX 平台为研究人员提供了卓越的高性能计算加速能力，以解决行业面临的那些最棘手的问题。”

行业领导者使用 HGX 平台推动创新突破

高科技产业先驱者通用电气正在使用HGX 平台，将 HPC 创新应用于计算流体动力学模拟，以指导大型燃气轮机和喷气发动机的设计创新。HGX平台在通用电气的 GENESIS 代码中实现了突破性CFD 方法的数量级加速，该代码采用大涡模拟来研究涡轮机内部湍流的影响。涡轮机由数百个单独的叶片组成，需要独特的复杂几何形状。

除了推动产业 HPC 转型外，HGX平台还在加速世界各地的科学 HPC 系统，包括同样在今日宣布的位于爱丁堡大学的新一代超级计算机。

NVIDIA A100 80GB PCIe GPU提升AI和HPC性能

NVIDIA A100 TensorCore GPU提供了前所未有的HPC加速能力，解决了与产业HPC相关的复杂AI、数据分析、模型训练和计算模拟等挑战。与A100 40GB相比，A100 80GB PCIe GPU的内存带宽增加了25%，达到2TB/s，并且提供80GB的HBM2e高带宽内存。

A100 80GB PCIe的巨大内存容量与高内存带宽，可以保存更多的数据和更大的神经网络，从而最大限度地减少节点间通信和能耗。凭借其更快的内存带宽，研究人员能够获得更高的吞吐量和更快得到结果，实现IT投资价值的最大化。

A100 80GB PCIe GPU基于NVIDIA Ampere架构。该架构内置Multi-Instance GPU（MIG）功能，可为AI推理等小型工作负载提供加速。MIG允许HPC系统缩小计算和内存规模的同时并保证服务质量。除了PCIe之外，还有四卡和八卡的NVIDIA HGX A100配置。

NVIDIA合作伙伴为A100 80GB PCIe GPU提供了广泛的支持，包括源讯（Atos）、思科（Cisco）、戴尔科技（Dell Technologies）、富士通（Fujitsu）、新华三（H3C）、慧与（Hewlett Packard Enterprise ）、浪潮（Inspur）、联想（Lenovo）、PenguinComputing、云达科技（QCT）以及超微（Supermicro）。通过NVLink 互连的基于 A100 GPU 的HGX 平台也可通过来自 AWS （Amazon Web Services）、Microsoft Azure 和Oracle Cloud Infrastructure 的云服务获得。

新一代NDR 400Gb/s InfiniBand交换机系统

NVIDIA InfiniBand是全球唯一具有完全卸载功能的网络计算的互连系统，为那些需要超大数据通道的HPC系统提供超强支持。通过NDR InfiniBand网络可以轻松扩展性能，以应对产业HPC和科学HPC系统面临的大量挑战。基于NVIDIA Quantum-2单芯片的交换机系统可提供64个NDR 400Gb/s InfiniBand端口（或128个NDR200端口），其端口密度比HDR InfiniBand高出3倍。

NVIDIA Quantum-2模块化交换机提供了可扩展的端口配置选项，最高可提供2048个NDR400Gb/s InfiniBand端口（或4096个NDR200端口），双向总吞吐量达到1.64Pb/s，是上一代HDR InfiniBand模块化交换机系列的5倍。相比上一代，这款2048端口交换机的扩展能力增加了6.5倍，采用DragonFly+网络拓扑，只需三个网络Hop就能连接超过一百万个节点。第三代 NVIDIA SHARP 网络计算数据归约技术，比上一代的AI 加速能力提高了 32 倍，可大幅提升高性能产业和科学应用的性能。

此外，NVIDIA UFM Cyber-AI平台还提供了先进的管理功能，如网络自修复功能等，以及NVIDIA网络计算加速引擎，进一步将数据中心的停机时间降至最低。

基于行业标准的NVIDIA Quantum-2 交换机（预计在年底前可出样品）具有向后和向前的兼容性，可以轻松迁移和扩展现有系统和软件。

包括源讯（Atos）、DDN、戴尔科技（DellTechnologies）、Excelero 、技嘉科技（GIGABYTE）、慧与（HPE）、联想（Lenovo）、PenguinComputing、云达科技（QCT）、超微（Supermicro）、VAST以及 WekaIO 在内的业内领先基础设施制造商等，均计划将Quantum-2 NDR 400Gb/s InfiniBand交换机集成到其企业级产品和HPC产品中。另外，包括Azure在内的云服务供应商们也正在使用InfiniBand技术。

Magnum IO GPUDirect Storage介绍

Magnum IO GPUDirect Storage提供GPU内存和存储之间的直接内存访问，实现了优异的复杂工作负载处理性能。这条直接的通路让应用程序从低I/O延迟中受益，并能够充分利用到网卡的全部带宽，同时减少CPU在通信中的负载，并可以管理逐渐增加的数据消耗所产生的影响。

支持 Magnum IO GPUDirect Storage（现已上市）的行业领导者包括 DDN、戴尔科技（Dell Technologies）、Excelero、慧与（HPE）、IBM Storage、Micron、NetApp、Pavilion、ScaleFlux、VAST 和 WekaIO。

想要了解 NVIDIA 的 Marc Hamilton 的最新消息和参与 NVIDIA HPC 专家的现场问答，请在北京时间6月29日中午12点30分收听 NVIDIA ISC2021 特别演讲。

编辑：jq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
31195

浏览量
269563
超级计算

超级计算

+关注

关注
1

文章
39

浏览量
11303
HPC

HPC

+关注

关注
0

文章
318

浏览量
23814
数据分析

数据分析

+关注

关注
2

文章
1453

浏览量
34087

原文标题：ISC2021 | NVIDIA与全球合作伙伴联合发布全新HGX A100系统，为产业AI和HPC提速

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

AI云端计算资源的多维度优势

AI云端计算资源，作为AI技术与云计算深度融合的产物，在

发表于 01-07 11:11 •77次阅读

云端超级计算机使用教程

云端超级计算机是一种基于云计算的高性能计算服务，它将大量计算资源和存储资源集中在一起，通过网络向

发表于 12-17 10:19 •149次阅读

赖耶科技通过NVIDIA AI Enterprise平台打造超级AI工厂

与 NVIDIA 技术团队保持合作。赖耶科技通过NVIDIA AI Enterprise平台打造的超级 AI 工厂，致力于加速大模型场景应用

发表于 11-19 14:55 •428次阅读

AI高性能计算平台是什么

AI高性能计算平台不仅是AI技术发展的基石，更是推动AI

发表于 11-11 09:56 •230次阅读

AI技术驱动半导体产业升级,芯原布局未来智能计算领域

随着AI技术在高性能计算、机器学习和深度学习等领域的广泛应用，对高性能芯片的需求日益增长，这直接

发表于 11-06 13:53 •489次阅读

NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

、超大规模的 AI 工厂提供卓越性能而设计的 RDMA（Remote Direct Memory Access）网络。 Colossus 是世界上最大的 AI 超级

发表于 10-30 09:33 •166次阅读

丹麦推出首台AI超级计算机Gefion

近日，丹麦正式推出了该国首台人工智能超级计算机，命名为Gefion，以纪念丹麦神话中的女神。此次揭幕仪式由英伟达首席执行官黄仁勋与丹麦国王共同出席，彰显了该项目的重要性和影响力。 Gefion

发表于 10-29 15:13 •420次阅读

NVIDIA助力丹麦发布首台AI超级计算机

这台丹麦最大的超级计算机由该国政府与丹麦 AI 创新中心共同建设，是一台 NVIDIA DGX SuperPOD 超级计算机。

发表于 10-27 09:42 •468次阅读

AI云平台与传统云计算的区别

AI云平台与传统云计算在定义、技术架构、应用场景和服务模式等方面存在显著差异。

发表于 10-14 10:08 •412次阅读

《AI for Science：人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

计算的结合我深刻体会到高性能计算（HPC）在AI for Science中的重要性。传统的科学计算

发表于 10-14 09:16

AI云平台的优势与应用

AI云平台，作为AI技术与云计算深度融合的产物，正以其独特的优势，

发表于 10-12 09:44 •233次阅读

芯品# 高性能计算芯片

（LSE：AWE）是全球技术基础设施高速连接和计算芯片的全球领导者，与Arm合作开发基于Arm ® Neoverse™计算子系统（CSS）的高级计算芯片，用于人工智能/机器学习（

发表于 06-27 10:28 •7019次阅读

新技术融合共生:5G、AI与云计算引领数字经济时代

随着科技的不断进步，5G、AI、云计算等新技术正以前所未有的速度蓬勃发展，它们如同夜空中最亮的星辰，交相辉映，共同编织着数字经济的宏伟蓝图。在这个变革的时代，我们站在新技术推动行业变革

发表于 06-13 17:02 •642次阅读

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

GB200 超级芯片模块组合而成，通过 Nvlink 链接，提供了超大规模的并行计算能力和极高的内存带宽，适用于大规模的 AI 训练、推理和高性能

发表于 05-13 17:16

NanoEdge AI的技术原理、应用场景及优势

NanoEdge AI 是一种基于边缘计算的人工智能技术，旨在将人工智能算法应用于物联网（IoT）设备和传感器。这种技术的核心思想是将数据处理和分析从云端转移到设备本身，从而减少数据传

发表于 03-12 08:09

搜索历史

VIDIA宣布在AI超级计算平台中加入融合了AI与高性能计算的新技术

评论

AI云端计算资源的多维度优势

云端超级计算机使用教程

赖耶科技通过NVIDIA AI Enterprise平台打造超级AI工厂

AI高性能计算平台是什么

AI技术驱动半导体产业升级,芯原布局未来智能计算领域

NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

丹麦推出首台AI超级计算机Gefion

NVIDIA助力丹麦发布首台AI超级计算机

AI云平台与传统云计算的区别

《AI for Science：人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

AI云平台的优势与应用

芯品# 高性能计算芯片

新技术融合共生:5G、AI与云计算引领数字经济时代

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

NanoEdge AI的技术原理、应用场景及优势