NVIDIA Blackwell平台推动科学计算突破发展-电子发烧友网

最新加速器和网络平台提升高级模拟、AI、量子计算、数据分析等方面的性能。

从量子计算到新药研发和聚变能源领域，随着加速计算和 AI 的进步，全球涌现了一项又一项重大突破，基于物理模拟的科学计算有望推进造福人类的各个领域大幅进步。

NVIDIA 在今年 3 月的 GTC 上发布了 NVIDIA Blackwell 平台，该平台可在万亿参数级大语言模型（LLM）上实现生成式 AI，而且其成本和能耗相较于 NVIDIA Hopper 架构最低可降至 1/25。

Blackwell 对 AI 工作负载具有重大的意义，其技术能力还将有助于推进包括传统的数值模拟在内的各类科学计算应用的探索工作。

加速计算和 AI 通过降低能源成本推动可持续计算。许多科学计算应用已从中受益。相较于基于传统 CPU 的系统和其他系统，天气模拟的成本和能耗分别降至其 1/200 和 1/300，数字孪生模拟的成本和能耗则分别降至其 1/65 和 1/58。

利用 Blackwell 实现科学计算模拟性能倍增

科学计算和基于物理的模拟通常依赖于所谓的双精度格式或 FP64（浮点）来解决问题。Blackwell GPU 的 FP64 和 FP32 FMA（融合乘加）性能比 Hopper 高出 30% 。

基于物理的模拟对产品设计和开发至关重要。无论是飞机、火车，还是桥梁、半导体芯片和药品，在模拟中对产品进行测试和改进能够为研究人员和开发人员节省数十亿美元。

现今的专用集成电路（ASIC）几乎完全是在 CPU 上设计的，整个流程漫长且复杂，包括进行模拟分析以确定电压和电流。

但这种情况正在发生改变。比如，Cadence SpectreX 模拟器就是一个典型的模拟电路设计求解器。SpectreX 电路模拟在 Grace Blackwell 超级芯片（由 Blackwell GPU 和 Grace CPU 连接而成）上的运行速度预计可达到传统 CPU 的 13 倍。

此外，GPU 加速的计算流体动力学（CFD）已成为一种重要工具。工程师和设备设计师用它来预测各种设计的行为。Cadence Fidelity 在 NVIDIA 的 Grace Blackwell 系统上运行 CFD 模拟的速度预计比传统基于 CPU 系统快 22 倍，前所未有的流动细节都可被捕捉到。

在另一项应用中，Cadence Reality 的数字孪生软件被用于创建物理数据中心的虚拟复制品，包括其服务器、冷却系统、电源在内的所有组件。这种虚拟模型可以让工程师在现实世界中进行应用之前，就能够提前对各种配置和方案进行测试，从而节省时间和成本。

Cadence Reality 的优异之处在于其基于物理的算法可以模拟热量、气流和用电量对数据中心的影响。这有助于工程师和数据中心运营人员更有效地管理容量，预测潜在的运行问题，并做出明智的决策，通过优化数据中心的布局和运行，从而提高效率和容量利用率。借助 Blackwell GPU，这些模拟的运行速度预计比 CPU 快高达 30 倍，从而加快了完成时间并提高了能效。

AI 在科学计算中的应用

全新 Blackwell 加速器和网络平台将大幅提升模拟性能。

NVIDIA Grace Blackwell 开启了高性能计算（HPC）的新时代。其架构采用第二代 Transformer 引擎，经过优化，可加速 LLM 推理工作负载。

与上一代 Hopper 架构 GPU 相比，Blackwell 架构使资源密集型应用如 1.8 万亿参数的 GPT-MoE（生成式预训练转换器-专家混合）模型实现了 30 倍的提速，为 HPC 开辟了新的可能性。通过让 LLM 处理和解读海量科学数据，高性能计算应用可以更快获得有价值洞察，从而加速科学探索。

桑迪亚国家实验室正在构建一个适用于并行编程的 LLM 智能助手。传统的 AI 可以高效生成基本的串行计算代码，但当涉及到 HPC 应用的并行计算代码时，LLM 就会显得力不从心。桑迪亚的研究人员正在通过一个雄心勃勃的项目解决这个问题，他们准备用 Kokkos 自动生成并行代码。Kokkos 是一种由多国实验室设计的编程语言，专门用于在全球最强大超级计算机的数万个处理器上运行任务。

桑迪亚国家实验室正在使用一种被称为检索增强生成（RAG）的 AI 技术将信息检索能力与语言生成模型相结合。该项目团队正在创建一个 Kokkos 数据库，并利用 RAG 将其与 AI 模型集成。

初步结果十分喜人。桑迪亚国家实验室采用的不同 RAG 方法已经自主生成了用于并行计算应用的 Kokkos 代码。他们希望通过克服 AI 并行代码生成中的障碍，为全球领先的超级计算设施提供新的 HPC 可能性。

其他示例包括可再生能源研究、气候科学和新药研发。

推动量子计算的进步

量子计算为聚变能、气候研究、新药研发等领域带来了大幅加速。因此，研究人员正努力在基于 NVIDIA GPU 的系统和软件上模拟未来的量子计算机，以前所未有的速度开发和测试量子算法。

NVIDIA CUDA-Q 平台通过一个实现 CPU、GPU 和 QPU（量子处理器）协同工作的统一编程模型，实现量子计算机模拟和混合应用开发。

CUDA-Q 正在加快巴斯夫化学工作流、石溪大学高能和核物理学研究以及 NERSC 量子化学的模拟速度。

NVIDIA Blackwell 架构将助推量子模拟达到新高度。通过最新的 NVIDIA NVLink 多节点互连技术，可以更快地打通数据以提高量子模拟速度。

加快数据分析以推动科学突破

使用 RAPIDS 处理数据的方式在科学计算领域非常常见。Blackwell 加入了一个硬件解压缩引擎，能够对压缩数据进行解压缩，并加快在 RAPIDS 中的分析速度。

该解压缩引擎可将性能提升至 800GB/s，使 NVIDIA Grace Blackwell 在查询基准测试中的性能较 CPU（在 Sapphire Rapids 上）快 18 倍，较 NVIDIA Hopper Tensor Core GPU 快 6 倍。

凭借 8TB/s 的高内存带宽和 Grace CPU 高速 NVLink 片间（C2C）互连技术，该引擎可大幅提高数据传输速度，进而加快整个数据库查询过程。Blackwell 能够在数据分析和数据科学用例中发挥出卓越性能，从而加快数据洞察速度并降低成本。

NVIDIA 网络平台为科学计算提供极致性能

NVIDIA Quantum-X800 InfiniBand 网络平台可为科学计算基础设施提供最高吞吐量。

该平台包含 NVIDIA Quantum Q3400 和 Q3200 交换机, 以及 NVIDIA ConnectX-8 SuperNIC，二者组合在带宽上可达上一代产品的两倍。Q3400 平台的带宽容量提高了 5 倍，并且借助 NVIDIA 的 SHARPv4（可扩展分层聚合和归约协议）技术实现了 14.4 Tflops 的网络计算能力，较上一代产品提高了 9 倍。

性能的飞跃和能效的提高，使科学计算的工作负载完成时间与能耗显著减少。

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

集成电路

集成电路

+关注

关注
5387

文章
11540

浏览量
361701
加速器

加速器

+关注

关注
2

文章
799

浏览量
37853
NVIDIA

NVIDIA

+关注

关注
14

文章
4983

浏览量
103006
量子计算

量子计算

+关注

关注
4

文章
1099

浏览量
34943

原文标题：ISC24 | NVIDIA Blackwell 平台推动科学计算突破发展

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

NVIDIA预测2025年AI行业发展

NVIDIA 加速计算、数据科学和研究领域专家预测，多模态模型将推动行业创新和效率提升。

发表于 12-18 13:49 •175次阅读

Supermicro推出直接液冷优化的NVIDIA Blackwell解决方案

，宣布推出高性能的SuperCluster。这一端对端AI数据中心解决方案采用NVIDIA Blackwell平台，专为兆级参数规模的生成式AI时代所设计。全新SuperCluster将可大幅增加液冷

发表于 11-25 10:39 •329次阅读

Supermicro推出直接液冷优化的<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Blackwell</b>解决方案

NVIDIA加速计算如何推动医疗健康

近日，NVIDIA 企业平台副总裁 Bob Pette 在 AI Summit 一场演讲中重点谈论了 NVIDIA 加速计算如何推动医疗健康

发表于 11-20 09:10 •291次阅读

NVIDIA向开放计算项目捐赠Blackwell平台设计

近日，在美国加利福尼亚州举行的 OCP 全球峰会上，NVIDIA 宣布已把 NVIDIA Blackwell 加速计算平台的一些基础元素捐赠

发表于 11-19 15:30 •191次阅读

NVIDIA Blackwell平台带来性能跃升

Blackwell 完成的每一项测试，都为各项 AI 应用树立了训练性能新标杆。

发表于 11-19 14:24 •187次阅读

NVIDIA未来1年的Blackwell订单已全部售罄

10月12日资讯显示，Blackwell无疑已成为NVIDIA历史上极为成功的产品典范，其市场需求量已攀升至前所未有的高峰。　　凭借在全球AI算力领域的领先地位，Blackwell吸引了微软、Meta、Oracle、Op

发表于 10-12 16:20 •638次阅读

英伟达联合计算机制造商发布Blackwell架构系统

近日，NVIDIA与全球多家知名计算机制造商联手，共同推出了一系列采用NVIDIA Blackwell架构的新系统。这些系统不仅配备了NVIDIA

发表于 06-06 10:52 •640次阅读

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

和推理的速度。英伟达 Blackwell 架构在高性能计算方面的应用为人工智能和其他计算密集型任务提供了更强大的处理能力和效率。这些应用将有助于推动

发表于 05-13 17:16

NVIDIA的专用AI平台如何推动下一代医疗健康行业的发展

医疗科技创新企业在 GTC 上介绍了 NVIDIA 的专用 AI 平台如何推动下一代医疗健康行业的发展。

发表于 04-09 10:10 •1275次阅读

基于NVIDIA开源CUDA-Q量子计算平台发布

NVIDIA 于太平洋时间 3 月 18 日推出一项云服务，旨在帮助研究人员和开发人员在化学、生物学、材料科学等关键科学领域的量子计算研究中取得突破

发表于 03-21 09:54 •432次阅读

NVIDIA推出搭载GB200 Grace Blackwell超级芯片的NVIDIA DGX SuperPOD™

NVIDIA 于太平洋时间 3 月 18 日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200 Grace Blackwell 超级芯片的

发表于 03-21 09:49 •700次阅读

NVIDIA宣布推出NVIDIA Blackwell平台以赋能计算新时代

全新 Blackwell GPU、NVLink 和可靠性技术赋能万亿参数规模的 AI 模型

发表于 03-20 09:44 •609次阅读

NVIDIA 推出云量子计算机模拟微服务

NVIDIA 量子模拟平台将通过各大云提供商提供，帮助科学家推进量子计算和算法研究 NVIDIA 的量子仿真

发表于 03-19 11:27 •440次阅读

NVIDIA 推出 Blackwell 架构 DGX SuperPOD，适用于万亿参数级的生成式 AI 超级计算

—— NVIDIA 于今日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200 Grace Blackwell 超级芯片的 NVI

发表于 03-19 10:56 •424次阅读

NVIDIA 人工智能开讲 | 什么是 AI For Science？详解 AI 助力科学研究领域的新突破

”两大音频 APP上搜索“ NVIDIA 人工智能开讲 ”专辑，众多技术大咖带你深度剖析核心技术，把脉未来科技发展方向！ AI For Science （亦称 “AI In Science” ），是人工智能领域的一大热门话题，即如何用人工智能助力

发表于 12-25 18:30 •1002次阅读

搜索历史

NVIDIA Blackwell平台推动科学计算突破发展

评论

NVIDIA预测2025年AI行业发展

Supermicro推出直接液冷优化的NVIDIA Blackwell解决方案

NVIDIA加速计算如何推动医疗健康

NVIDIA向开放计算项目捐赠Blackwell平台设计

NVIDIA Blackwell平台带来性能跃升

NVIDIA未来1年的Blackwell订单已全部售罄

英伟达联合计算机制造商发布Blackwell架构系统

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

NVIDIA的专用AI平台如何推动下一代医疗健康行业的发展

基于NVIDIA开源CUDA-Q量子计算平台发布

NVIDIA推出搭载GB200 Grace Blackwell超级芯片的NVIDIA DGX SuperPOD™

NVIDIA宣布推出NVIDIA Blackwell平台以赋能计算新时代

NVIDIA 推出云量子计算机模拟微服务

NVIDIA 推出 Blackwell 架构 DGX SuperPOD，适用于万亿参数级的生成式 AI 超级计算

NVIDIA 人工智能开讲 | 什么是 AI For Science？详解 AI 助力科学研究领域的新突破