从云端到网络边缘,NVIDIA GH200、H100和L4 GPU以及Jetson Orin模组在运行生产级 AI 时均展现出卓越性能。

NVIDIA GH200 Grace Hopper超级芯片首次亮相 MLPerf 行业基准测试,其运行了所有数据中心推理测试,进一步扩大了NVIDIA H100 Tensor Core GPU的领先优势。
总体测试结果表明,NVIDIA AI 平台无论是在云端还是网络边缘均展现出卓越的性能和通用性。
此外,NVIDIA宣布推出全新推理软件,该软件将为用户带来性能、能效和总体拥有成本的大幅提升。
GH200 超级芯片在 MLPerf 一骑绝尘
GH200将一颗Hopper GPU和一颗Grace CPU连接到一个超级芯片中。这种组合提供了更大内存、更快带宽,能够在CPU和GPU之间自动切换计算所需要的资源,实现性能最优化。
具体而言,内置8颗H100 GPU 的 NVIDIA HGX H100系统,在本轮每项MLPerf推理测试中均实现了最高吞吐量。
Grace Hopper 超级芯片和H100 GPU在所有MLPerf数据中心测试中均处于领先地位,包括针对计算机视觉、语音识别和医学成像的推理,以及应用于生成式AI的推荐系统和大语言模型(LLM) 等对性能要求更高的用例。
总体而言,此次测试结果延续了自2018年MLPerf基准测试推出以来,NVIDIA在每一轮AI训练和推理中都处于领先性能的纪录。
最新一轮MLPerf 测试包括一项更新的推荐系统测试,并新增首个GPT-J上的推理基准测试。GPT-J是一个由60亿个参数组成的大语言模型(LLM),而AI模型的大小通常根据它有多少参数来衡量。
TensorRT-LLM 大幅提升推理能力
为了应对各类复杂的工作负载,NVIDIA开发了一款能够优化推理的生成式AI软件——TensorRT-LLM。该开源库使客户能够在不增加成本的情况下将现有H100 GPU的推理性能提升两倍以上。由于时间原因,TensorRT-LLM没有参加8月的MLPerf提交。

NVIDIA的内部测试表明, 在运行 GPT-J 6B 模型时,相较于没有使用TensorRT-LLM的上一代GPU,在H100 GPU上使用TensorRT-LLM能够实现高达8倍的性能提升。
该软件始于NVIDIA在对Meta、AnyScale、Cohere、Deci、Grammarly、Mistral AI、MosaicML(现为Databricks的一部分)、OctoML、Tabnine和Together AI等领先公司进行加速和优化LLM推理时所做的工作。
MosaicML在TensorRT-LLM 的基础上添加了所需的功能,并将这些功能集成到他们现有的服务堆栈中。Databricks工程副总裁Naveen Rao表示:“这已成为相当轻而易举的事情。”
Rao补充说:“TensorRT-LLM 简单易用、功能丰富且高效。它为正在使用NVIDIA GPU的 LLM服务提供了最先进的性能,并使我们能够将节省的成本回馈给我们的客户。”
TensorRT-LLM 是NVIDIA全栈AI平台持续创新的最新实例。这类持续的软件进步为用户带来了无需额外成本即可实现随着时间不断提升的性能,并且广泛适用于多样化的AI工作负载。
L4为主流服务器增强推理能力
在最新MLPerf基准测试中,NVIDIA L4 GPU 运行了所有工作负载,并全面展现了出色的性能。
例如,在紧凑型72W PCIe 加速器中运行时,L4 GPU的性能比功耗超出其近5倍的CPU提高了6倍。
此外,L4 GPU具有专用媒体引擎,与CUDA软件搭配使用,在NVIDIA的测试中为计算机视觉提供了高达120倍的加速。
谷歌云和许多系统制造商现已支持L4 GPU,为从消费互联网服务到药物研发各行业的客户提供服务。
大幅提升边缘性能
此外,NVIDIA采用了一种全新模型压缩技术来展示在一个L4 GPU上运行BERT LLM的性能提升高达4.7倍。该结果体现在MLPerf的“开放分区”中,这个类别旨在展示新能力。
这项技术有望应用于所有AI工作负载。它尤其适用于在空间和功耗受限的边缘设备上运行模型。
在另一个体现边缘计算领导力的例证中,NVIDIA Jetson Orin模块化系统将边缘AI和机器人应用场景中常见的计算机视觉用例——目标检测的性能比上一轮测试提升高达84%。

Jetson Orin性能的提升得益于软件可以充分利用该芯片的最新核心,如一个可编程视觉加速器、一颗NVIDIA Ampere架构GPU和一个专用深度学习加速器等。
灵活的性能与庞大的生态
MLPerf基准测试是透明且客观的,因此用户可以根据其结果做出明智的购买决定。该测试还涵盖了丰富的用例和场景,能够让用户获得可靠且可以灵活部署的性能。
本轮提交测试结果的合作伙伴包括微软 Azure和Oracle Cloud Infrastructure 等云服务提供商以及华硕、Connect Tech、戴尔科技、富士通、技嘉、惠与、联想、QCT、超微等系统制造商。
总体而言,MLPerf 已得到70多家机构的支持,包括阿里巴巴、Arm、思科、谷歌、哈佛大学、英特尔、Meta、微软和多伦多大学等。
请阅读技术博客,详细了解我们如何实现这些最新的成果。
NVIDIA在基准测试中使用的所有软件均可从 MLPerf 软件库中获得,因此每个人都能实现全球领先的结果。我们不断将这些优化措施整合到NVIDIA NGC软件中心的容器中供GPU应用使用。
NVIDIA Grace Hopper超级芯片横扫MLPerf推理基准测试
- NVIDIA(109323)
相关推荐
热点推荐
多家领先厂商采用全球首批基于NVIDIA Grace CPU的系统设计
加利福尼亚州圣克拉拉 —— COMPUTEX —— 太平洋时间2022年5月23日 —— NVIDIA于今日宣布,多家领先的计算机制造商将发布首批基于 NVIDIA Grace™ CPU超级芯片
2022-05-24 16:05:24
2666
2666
NVIDIA创下6项人工智能性能
在最新公布的业内首套人工智能基准测试中,NVIDIA创下6项人工智能性能记录。NVIDIA在其提交的 6个 MLPerf 基准测试结果中均取得了最佳表现。这些测试涵盖了多种工作负载和基础架构规模 – 从单节点上的16颗GPU到跨80节点上的多达640颗GPU。
2018-12-17 08:32:30
2711
2711NVIDIA扩大AI推理性能领先优势,首次在Arm服务器上取得佳绩
最新MLPerf基准测试表明,NVIDIA已将其在AI推理性能和能效方面的高标准扩展到Arm以及x86计算机。
2021-09-23 14:18:06
2953
2953
云服务、OEM 借助 NVIDIA AI让AI训练更上层楼
借助 NVIDIA AI,戴尔、浪潮、Microsoft Azure 和 Supermicro 在今天发布的新 MLPerf 基准测试中创下快速训练 AI 模型的记录。
2021-12-03 10:19:52
1853
1853
MLPerf V2.0推理结果放榜,NVIDIA表现抢眼
不久前,AI性能基准评测平台MLPerf公布了2022年首次推理(Inference v2.0)测试成绩,NVIDIA的AI平台表现依然抢眼。
2022-04-15 22:12:00
4142
4142
NVIDIA Grace CPU迎来首批玩家,多家厂商将推出基于它的全新数据中心系统
NVIDIA在Computex前夕宣布,多家计算机制造厂商将发布首批基于NVIDIA Grace CPU超级芯片和Grace Hopper超级芯片的系统,这些系统主要用于数字孪生、AI、HPC、云图形和游戏等各类工作负载。
2022-05-24 11:54:46
3593
3593
Supermicro为业界领先的高性能计算、数据分析和云游戏应用组合添加搭载NVIDIA Grace CPU超级芯片的服务器
和绿色计算技术等领域的全球领导者,计划将NVIDIA Grace CPU 超级芯片部署至针对AI、HPC、资料分析、数字孪生(Digital Twins)和计算密集型应用优化的各种服务器中。随着人工智能
2022-05-25 18:26:00
3958
3958
全球领先系统制造商加速采用NVIDIA Grace和Grace Hopper
芯片和NVIDIA Grace Hopper™超级芯片的服务器。 所有这些新系统都得益于刚刚发布的NVIDIA HGXTM平台中的Grace和
2022-05-31 14:46:33
1575
1575
NVIDIA 如何应对会话式AI带来的推理挑战?
NVIDIA Turing GPU和Xavier 芯片系统在首个独立AI推理基准测试 ——MLPerf Inference 0.5中取得第一名。
2019-11-08 16:53:29
5804
5804性能提升20倍!NVIDIA A100 GPU打破16项AI芯片性能记录
5月的行业基准测试组织,致力于机器学习硬件、软件和服务的训练和推理性能测试,囊括行业中几乎所有知名企业和机构,比如Intel、NVIDIA、Google、微软、阿里巴巴等。 DGX Su
2020-07-31 08:03:00
6615
6615NVIDIA打破AI推理性能记录
NVIDIA凭借A100进一步扩大了在MLPerf基准测试中的领先优势,实现了比CPU快237倍的AI推理性能,助力企业将AI研究转化为生产力。
2020-10-22 14:07:58
1068
1068宁畅AI服务器X640 首登MLPerf 斩获30项世界第一
宁畅工程师介绍,参加MLPerf Inference(推理)基准测试的X640 G30 AI服务器,最高可支持10张NVIDIA A100 PCIe卡或21张NVIDIA T4 PCIe卡,堪称“性能猛兽”。
2020-10-23 10:48:37
989
989进入容器,即开即用:NVIDIA和VMware为企业提供大规模AI服务
戴尔科技EMC PowerEdge R7525服务器近期在MLPerf基准测试中使用三个NVIDIA A100 Tensor Core GPU运行NVIDIA AI Enterprise和VMware vSphere,取得了94.4%至100%的等效裸机性能。
2021-10-08 10:10:47
1842
1842
NVIDIA推出DGX GH200 AI超级计算机
——2023年5月29日—— NVIDIA今天宣布推出一款新型大内存AI超级计算机——由NVIDIA® GH200 Grace Hopper超级芯片和NVIDIA NVLink® Switch System
2023-05-30 14:15:36
1010
1010
大家都在争相超过A100,无人对标的Grace Hopper性能几何?
电子发烧友网报道(文/周凯扬)作为英伟达在CPU与GPU技术开发上的集大成之作,Grace Hopper很大程度上象征着复杂计算领军产品。尽管英伟达竭尽所能地去堆这一“超级芯片”的性能,但英伟达还是
2023-09-06 01:10:00
2336
2336
NVIDIA 在首个AI推理基准测试中大放异彩
Turing GPU、Xavier芯片系统在MLPerf基准测试中展现了巨大优势 加利福尼亚州圣克拉拉市 —— 2019年11月6日 ——相信很多关注AI的人都知道,NVIDIA GPU曾于去年12
2019-11-08 19:44:51
Arm Neoverse NVIDIA Grace CPU 超级芯片:为人工智能的未来设定步伐
NVIDIA 的基准测试显示 Grace CPU Superchip 在 SPECrate ® 2017_int_base 基准测试中达到了 740 的估计性能。NVIDIA Grace Hopper 超级
2022-03-29 14:40:21
是否有来自NVIDIA的基准测试
是否会有来自NVIDIA的基准测试,以检查我是否完全正确实现了这些卡,以及我的调整是否正确?以上来自于谷歌翻译以下为原文Will there be Benchmarks from NVIDIA
2018-09-29 14:28:32
进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片
NVLink 芯片到芯片(C2C)互连,显著加快数据库查询过程。在查询基准测试中,Grace Blackwell 的执行速度比 CPU (Sapphire Rapids)快 18 倍,比 NVIDIA
2024-05-13 17:16:22
谷歌、百度、英特尔、AMD、哈佛大学与斯坦福大学联合发布了新型基准测试工具 MLPerf
我们期待看到 AI 行业最终会迎来怎样的基准测试前景——少数垄断,还是百家争鸣。在这样一个年轻的市场当中,相信会有很多厂商提供基准测试工具与服务。斯坦福大学就是 MLPerf 项目成员,其最近刚刚发布了首个 DAWNBench v1 深度学习测试结果。
2018-05-07 15:24:37
5227
5227NVIDIA下下代GPU核心架构将是Hopper
来自国外的最新爆料称,NVIDIA的下一代GPU核心架构是Ampere(安培),下下代将是Hopper,用于纪念Grace Hopper(格蕾丝·赫柏)。
2019-06-12 15:53:20
2266
2266NVIDIA在最新AI推理基准测试中大获成功
MLPerf Inference 0.5是业内首个独立AI推理基准套件,其测试结果证明了NVIDIA Turing数据中心GPU以及 NVIDIA Xavier 边缘计算芯片系统的性能。
2019-11-29 14:45:02
3397
3397谷歌计划部署一条名为Grace Hopper的海底光缆系统
互联网巨头谷歌公司近日宣布了一项新的计划,即计划部署一条新的海底光缆系统,连接美国纽约、英国布德、西班牙毕尔巴鄂,全称Grace Hopper系统。
2020-08-03 17:14:50
574
574
最新测试:NVIDIA的安培GPU测试性能是最先进 CPU的237倍
MLPerf组织今天发布最新的推理基准测试(Benchmark)MLPerf Inference v0.7结果,总共有23个组织提交了结果,相比上一个版本(MLPerf Inference v0.5)的12个提交者增加了近一倍。
2020-10-23 09:49:58
3875
3875
NVIDIA A100 GPU推理性能237倍碾压CPU
MLPerf组织今天发布最新的推理基准测试(Benchmark)MLPerf Inference v0.7结果,总共有23个组织提交了结果,相比上一个版本(MLPerf Inference v0.5
2020-10-23 17:40:02
5131
5131
Nvidia扩大了在MLPerf Benchmark上进行AI推理的领先优势
弗洛伊德说:“英伟达在竞争激烈的竞争者中表现出色。” 与(Nvidia)V100(GPU)相比,他们的A100效果惊人,证明了其增强的Tensor核心架构的价值。我赞扬MLPerf添加了新的基准,这些基准越来越代表快速增长的推理机会,例如推荐引擎。
2020-10-24 09:17:15
2641
2641机器学习记录:NVIDIA再次打破MLPerf基准测试的性能记录
由人工智能专家和计算机公司组成的联盟MLPerf发布了一组新的机器学习记录。这些记录是在一系列衡量推理速度的基准上设定的:一个已经训练过的神经网络能多快地用新数据完成任务。手机和平板电脑的基准测试
2020-11-17 17:47:12
2434
2434NVIDIA赢得四项最新行业指标
基准测试,而 NVIDIA 赋能的系统在该基准的五项测试中胜出四项。 MLPerf 是用于深度学习的行业基准测试,首次发布于 2018 年 5 月。上述战绩是 MLPerf 基准测试的最新结果
2021-11-21 10:57:47
2031
2031浪潮信息MLPerf单机系统测试:7项性能第一
日前,国际权威AI基准测试MLPerf公布了最新一期训练(Training)榜单V1.1,浪潮信息凭借旗下AI服务器NF5688M6和NF5688M6的出色表现,在单机系统测试的全部8项固定任务中
2021-12-08 10:35:20
1244
1244
MLPerf训练性能测试榜单发布,浪潮信息刷新多项纪录
,成为本次训练榜单中的最大赢家。 MLCommons每年组织2次MLPerf 推理性能测试和2次MLPerf 训练性能测试,其中固定任务由于要求使用相同模型和优化器测试标准十分严格,因而广受厂商和客户看重。MLPerf最新一次训练性能基准评测涵盖了8类极具代表性的机器学习任
2021-12-14 10:25:42
2803
2803
NVIDIA为需要加速计算的企业客户运行测试服务器
借助 NVIDIA AI,戴尔、浪潮、Microsoft Azure 和 Supermicro 在今天发布的新 MLPerf 基准测试中创下快速训练 AI 模型的记录
2021-12-15 15:35:44
1972
1972NVIDIA 推出 Grace CPU 超级芯片
NVIDIA Grace™ CPU 超级芯片由两个 CPU 芯片组成,它们之间通过NVLink®-C2C互连在一起。NVLink®-C2C 是一种新型的高速、低延迟、芯片到芯片的互连技术。
2022-03-23 11:25:41
2320
2320
GTC2022大会亮点:Grace超级芯片将是最强大CPU
GTC2022大会亮点:Grace超级芯片将是最强大CPU,将在AI、数据分析、科学计算和超大规模计算领域有着惊人的表现,拥有144个CPU核心。
2022-03-24 16:36:15
2696
2696
NVIDIA发布最新Hopper架构的H100系列GPU和Grace CPU超级芯片
今日凌晨,NVIDIA(英伟达)发布了基于最新Hopper架构的H100系列GPU和Grace CPU超级芯片!
2022-03-26 09:07:05
3786
3786英伟达推出NVIDIA Grace CPU
NVIDIA Grace CPU是首款面向AI基础设施和高性能计算的基于Arm Neoverse的数据中心专属CPU,是当今领先服务器芯片内存带宽和能效的两倍。
2022-03-30 14:11:31
2145
2145通过全堆栈优化提升MLPerf v1.1的性能
所有用于 NVIDIA 提交的软件都可以从 MLPerf 存储库中获得,以使您能够重现我们的基准测试结果。我们不断地将这些尖端的 MLPerf 改进添加到 NGC 上提供的深度学习框架容器中,这是我们针对 GPU 优化应用程序的软件中心。
2022-04-02 11:23:02
1647
1647
NVIDIA发布最新Orin芯片提升边缘AI标杆
在首次参加行业 MLPerf 基准测试时,基于 NVIDIA Ampere 架构的低功耗系统级芯片 NVIDIA Orin 就创造了新的AI推理性能纪录,并在边缘提升每个加速器的性能。
2022-04-08 10:14:44
5582
5582
利用MLPerf 推理 1.1提升NVIDIA绩效领导力
NGC 可通过您首选的云提供商的市场免费获得。在那里,您可以找到 TensorRT 和 NVIDIA Triton 的最新版本,这两个版本都有助于生成最新的 MLPerf 推断 1.1 结果。
2022-04-08 16:03:01
1724
1724
工业富联采用基于英伟达的超级芯片NVIDIA Grace CPU
5月24日,工业富联宣布采用基于英伟达NVIDIA HGX、OVX和CGX系统设计的超级芯片NVIDIA Grace CPU和NVIDIA Grace Hopper Superchip,以满足超级数据中心及边缘运算等更高的算力需求。
2022-05-26 15:17:55
4994
4994NVIDIA Grace超级芯片为HPC及AI工作负载提速
NVIDIA于今日宣布,多家全球领先的计算机制造商正在采用全新NVIDIA Grace™超级芯片打造新一代服务器,为超大规模时代的AI和HPC工作负载提速。
2022-05-31 19:28:41
3112
3112
计算机制造商采用全新NVIDIA Grace超级芯片打造新一代服务器
源讯、戴尔科技,技嘉科技、慧与、浪潮、联想和超微成为首批将基于 NVIDIA Grace 的 HGX 系统用于 HPC 和 AI 的制造商。
2022-06-01 10:32:42
1755
1755如何对推理加速器进行基准测试
客户对基准推理学习曲线的最后阶段是开发自己的模型,使用通常来自 Nvidia 或数据中心的训练硬件/软件,然后在可能的目标推理加速器上对该模型进行基准测试。
2022-06-06 16:02:21
1935
1935NVIDIA AI平台在MLPerf基准测试实现飞跃
NVIDIA AI 仍是唯一能够运行 MLPerf 行业基准测试中所有测试的平台, A100 GPU 自发布以来连续两年一直保持着获胜次数最多的纪录。
2022-07-01 10:52:08
1631
1631MLPerf是边缘AI推理的新行业基准
最新的 AI 推理基准显然具有重要意义,因为它是目前可用的最接近真实世界 AI 推理性能的衡量标准。但随着它的成熟和吸引更多的提交,它也将成为成功部署技术堆栈的晴雨表和新实施的试验场。
2022-07-08 15:37:55
2384
2384
MLPerf 扩展 AI 推理基准测试,Nvidia 在所有测试中名列前茅
英伟达在所有六个应用领域的 MLPerf AI 推理基准测试中均名列前茅,其中包括针对数据中心和边缘计算系统的四个新测试。
2022-08-18 15:41:58
1223
1223
英伟达Grace Hopper CPU架构
英伟达SCF 在各种 Grace 芯片单元(如 CPU 内核、内存和 I/O)之间提供 3.2 TB/s 的双向带宽,更不用说将芯片连接到主板上其他单元(无论是另一个Grace CPU还是Hopper GPU)的NVLink-C2C接口。
2022-08-23 16:02:31
2806
2806NVIDIA即将推出首批基于开创性 NVIDIA Hopper 架构的产品和服务
NVIDIA 于今日宣布 NVIDIA H100 Tensor Core GPU 全面投产,NVIDIA 全球技术合作伙伴计划于 10 月推出首批基于开创性 NVIDIA Hopper 架构的产品和服务。
2022-09-22 10:45:01
1712
1712NVIDIA Grace Hopper超级芯片赋能推荐系统
借助 Grace Hopper 超级芯片,有助于用户个性化互联网的大规模 AI 模型的性能更加准确。
2022-09-23 11:32:08
2053
2053NVIDIA为HPC和AI加强超级芯片工程
NVIDIA Grace CPU 是 NVIDIA 开发的第一个数据中心 CPU 。它是从头开始建造的,以创建 世界上第一个超级芯片 。
2022-10-11 09:40:05
2223
2223
深度解读英伟达最强异构平台:NVIDIA Grace Hopper Superchip
NVIDIA Grace Hopper Superchip 架构是第一个真正的异构加速平台,适用于高性能计算(HPC) 和AI工作负载。它利用 GPU 和 CPU 的优势加速应用程序,同时提供迄今为止最简单、最高效的分布式异构编程模型。
2022-11-14 10:13:52
1795
1795深入解读NVIDIA Grace Hopper Superchip架构
NVIDIA NVLink-C2C 是一种 NVIDIA 内存一致性、高带宽和低延迟的超级芯片互连。它是 Grace Hopper Superchip 的核心,提供高达 900 GB/s 的总带宽。这比加速系统中常用的 x16 PCIe Gen5 通道高 7 倍。
2022-11-18 10:15:18
1310
1310深入解读Grace CPU芯片架构
NVIDIA Grace CPU 超级芯片是使用两个通过 NVLink-C2C 连接的 Grace CPU 构建的。该超级芯片建立在现有 Arm 生态系统的基础上,为 HPC、要求苛刻的云工作负载以及高性能和高能效的密集基础设施创建了首个毫不妥协的 Arm CPU。
2023-02-02 11:47:09
2420
2420NVIDIA推出用于大型语言模型和生成式AI工作负载的推理平台
软件与最新的NVIDIA Ada、Hopper和Grace Hopper处理器相结合,包括今天推出的NVIDIA L4 Tensor Core GPU和NVI
2023-03-22 14:48:39
533
533
GTC23 | NVIDIA 推出用于大型语言模型和生成式 AI 工作负载的推理平台
的全栈推理软件与最新的 NVIDIA Ada、Hopper 和 Grace Hopper 处理器相结合,包括今天推出的 NVIDIA L4 Tensor Core GPU 和
2023-03-23 06:55:02
1493
1493NVIDIA 在 MLPerf 测试中将推理带到新高度
的第三方基准测试,MLPerf 仍是衡量 AI 性能的权威标准。自 MLPerf 诞生以来,NVIDIA 的 AI 平台在训练和推理这两个方面一直展现出领先优势,包括最新发布的 MLPerf
2023-04-08 00:30:08
1019
1019MLPerf 3.0最新发榜,戴尔AI和边缘服务器拿下历史最好成绩
计算基准测试,包含Training(训练)和Inference(推理)两大领域。MLPerf选择AI各个热门领域的经典模型,在满足技术规范前提
2023-04-12 18:55:35
2752
2752NVIDIA Grace 掀起新型节能 Arm 超级计算机的新浪潮
基于 NVIDIA Grace CPU 超级芯片 的超级计算机,为基于 Arm Neoverse 平台的新型节能超级计算机掀起了一轮新的浪潮。 Isambard 3 超级计算机位于英国布里斯托和巴斯科学园,将
2023-05-23 07:10:02
972
972COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超级计算机
—2023 年 5 月 29 日— NVIDIA 今天宣布推出一款新型大内存 AI 超级计算机——由 NVIDIA GH200 Grace Hopper 超级芯片和 NVIDIA NVLink
2023-05-30 01:40:01
2531
2531
NVIDIA 与软银公司合作,利用 Grace Hopper 超级芯片建设面向生成式 AI 和 5G/6G 的软银下一代数据中心
宣布,双方正在合作打造一个基于 NVIDIA GH200 Grace Hopper 超级芯片 、面向生成式 AI 和 5G/6G 应用的开创性平台。软银计划在日本各地的全新分布式 AI 数据中心采用该
2023-05-30 01:40:02
1373
1373
COMPUTEX2023 | 为加速生成式 AI 而设计的 NVIDIA Grace Hopper 超级芯片全面投产
29 日 — NVIDIA 于今日宣布 NVIDIA GH200 Grace Hopper 超级芯片 全面投产,将为全球各地即将上线的系统提供运行复杂 AI 和 HPC 工作负载所需的动力。 这些由
2023-05-30 01:40:02
1473
1473
NVIDIA为加速生成式AI而设计的超级芯片全面投产
5 月29 日,英伟达在 2023 台北电脑展大会推出了DGX GH200 AI超级计算机,这是配备256颗Grace Hopper超级芯片和NVIDIA NVLink交换机系统的尖端系统,具有1 exaflop性能和144TB共享内存。
2023-06-01 15:59:23
1357
1357
NVIDIA Hopper GPU上的新cuBLAS12.0功能和矩阵乘法性能
NVIDIA Hopper GPU 上的新 cuBLAS 12.0 功能和矩阵乘法性能
2023-07-05 16:30:38
4242
4242
新的 MLPerf 推理网络部分展现 NVIDIA InfiniBand 网络和 GPUDirect RDMA 的强大能力
在 MLPerf Inference v3.0 中,NVIDIA 首次将网络纳入了 MLPerf 的评测项目,成为了 MLPerf 推理数据中心套件的一部分。网络评测部分旨在模拟在真实的数据中心
2023-07-19 19:10:03
1852
1852
SIGGRAPH主题演讲:NVIDIA首席执行官带来生成式AI多项创新
黄仁勋发布最新GH200 Grace Hopper 超级芯片和NVIDIA AI Workbench,并宣布更新NVIDIA Omniverse,使其支持生成式AI
2023-08-09 14:20:09
2822
2822
英伟达全球首发超级AI芯片 训练大模型成本更低
黄仁勋向数千名开发者和图形专业人士发表讲话,宣布更新 GH200 Grace Hopper 超级芯片、英伟达 AI Workbench,并将把生成式 AI 引入英伟达 Omniverse。
2023-08-09 14:42:55
1758
1758NVIDIA CPU+GPU超级芯片大升级!
NVIDIA官方宣布了新一代GH200 Grace Hopper超级芯片平台,全球首发采用HBM3e高带宽内存,可满足世界上最复杂的生成式AI负载需求。
2023-08-10 09:37:12
2337
2337
英伟达全球首发HBM3e 专为生成式AI时代打造
2023年8月8日,NVIDIA创始人兼CEO黄仁勋在计算机图形年会SIGGRAPH上发布了HBM3e内存新一代GH200 Grace Hopper超级芯片。这款芯片被黄仁勋称为“加速计算和生成式AI时代的处理器”,旨在用于任何大型语言模型,以降低推理成本。
2023-08-11 16:29:17
2011
2011全球GPU呈现“一超一强”竞争格局
目前英伟达产品 DGX GH200 已发布,互连技术强大,算力进一步升级。5月 29 日,英伟达在其发布会上,正式发布最新的 GH200 Grace Hopper 超级芯片,以及拥有 256 个 GH200 超级芯片的 NVIDIA DGX GH200 超级计算机。
2023-08-14 11:51:56
2865
2865
NVIDIA最强CPU芯片架构——NVIDIA Grace CPU
NVIDIA Grace Hopper Superchip将节能、高带宽的 NVIDIA Grace CPU 与功能强大的 NVIDIA H100 Hopper GPU 结合使用 NVLink-C2C,以最大限度地提高强大的高性能计算 (HPC) 和巨型 AI 工作负载的能力。
2023-08-30 10:45:44
2655
2655
NVIDIA Grace Hopper 超级芯片横扫 MLPerf 推理基准测试
超级芯片 首次亮相 MLPerf 行业基准测试,其运行了所有数据中心推理测试,进一步扩大了 NVIDIA H100 Tensor Core GPU 的领先优势。 总体测试结果表明,NVIDIA AI
2023-09-12 20:40:04
900
900英伟达分享Grace CPU Superchip的新基准
Nvidia 分享了该公司Grace CPU Superchip的新基准。下一代基于 Arm Neoverse 的芯片将为数据中心提供动力,在相同功耗下,其性能是 AMD 第四代EPYC Genoa和英特尔第四代Sapphire Rapids Xeon处理器的两倍。
2023-09-18 15:57:03
998
998
SC23 | 新型加速节能 AI 系统开创超级计算的新时代
世界各地的研究人员将在配备最新 NVIDIA Hopper GPU 和 NVIDIA Grace Hopper 超级芯片的系统上,借助生成式 AI 和 HPC 来应对科学和工业领域的重大挑战。 11
2023-11-15 18:45:01
1309
1309
亚马逊云科技与 NVIDIA 宣布开展战略合作,为生成式 AI 提供全新超级计算基础架构、软件和服务
亚马逊云科技将提供首款搭载 NVIDIA Grace Hopper 超级芯片 和亚马逊云科技可扩展性 UltraCluster 的云 AI 超级计算机。 首款采用 NVIDIA GH200
2023-11-29 21:00:01
1198
1198
AWS成为第一个提供NVIDIA GH200 Grace Hopper超级芯片的提供商
2023年的AWS re:Invent大会上,AWS和NVIDIA宣布AWS将成为第一个提供NVIDIA GH200 Grace Hopper超级芯片的云服务提供商。
2023-11-30 09:24:11
1575
1575
英伟达Grace-Hopper提供一个紧密集成的CPU + GPU解决方案
英伟达Grace-Hopper提供了一个紧密集成的CPU + GPU解决方案,针对生成式人工智能逐渐成为主导的市场环境。
2024-01-02 15:52:55
1712
1712NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算
基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术,可将集群中 Grace Blackwell 超级芯片的数量扩展至数万个,通过 NVIDIA NVLink可将多达 576 块
2024-03-19 10:56:35
1126
1126
NVIDIA推出搭载GB200 Grace Blackwell超级芯片的NVIDIA DGX SuperPOD™
NVIDIA 于太平洋时间 3 月 18 日发布新一代 AI 超级计算机 —— 搭载 NVIDIA GB200 Grace Blackwell 超级芯片的 NVIDIA DGX SuperPOD™。
2024-03-21 09:49:29
1927
1927美国首个Grace Hopper架构超算Venado落地:达10 exaFLOPS
该超级计算机是由惠普企业集团(Hewlett Packard Enterprise)打造,其运算能力高达 10 exaFLOPS,它是美国第一款采用英伟达Grace Hopper芯片架构的超级计算机系统。
2024-04-18 14:37:09
933
933NVIDIA通过CUDA-Q平台为全球各地的量子计算中心提供加速
德国、日本和波兰的超级计算机利用 Grace-Hopper 和量子-经典加速超算平台推进量子计算研究。
2024-05-14 09:15:41
979
979NVIDIA Grace Hopper点亮AI超级计算新时代
瑞士 Alps、法国 EXA1-HE 等超级计算机将使用高能效的、基于 Grace 的系统为气候和天气、科学探索等领域提供 200 EFLOPS AI 算力,以支持突破性研究。
2024-05-15 09:46:51
1115
1115亚马逊未中断英伟达订单,等待Grace Blackwell更强性能
英国《金融时报》昨日报道称,亚马逊AWS已暂停订购英伟达最新款“超级芯片”Grace Hopper,等待性能更强的新品Grace Blackwell(GH200)。此举引发市场担忧,认为英伟达可能面临产品周期间需求下降。
2024-05-22 11:00:02
916
916NVIDIA AI Enterprise荣获金奖
NVIDIA AI Enterprise、GH200 Grace Hopper 超级芯片和 Spectrum-X 在 COMPUTEX 2024 获得认可。
2024-05-29 09:27:50
1132
1132
NVIDIA AI芯片Blackwell推迟发布引热议,公司强调Hopper需求强劲
据8月5日最新消息,NVIDIA新款AI芯片Blackwell因被曝存在设计缺陷而推迟发布的消息,迅速在业界引发了广泛讨论与关注。面对这一市场传闻,NVIDIA官方迅速作出回应,强调其旗舰产品
2024-08-05 15:05:17
1163
1163浪潮信息AS13000G7荣获MLPerf™ AI存储基准测试五项性能全球第一
北京2024年9月27日 /美通社/ -- 9月25日,MLCommons协会发布最新MLPerf™ Storage v1.0 AI存储基准测试成绩。浪潮信息分布式存储平台AS13000G7表现出
2024-09-28 16:46:26
701
701
NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机
市的 Colossus 超级计算机集群达到了 10 万颗 NVIDIA® Hopper GPU 的巨大规模。该集群使用了 NVIDIA Spectrum-X™ 以太网网络平台,该平台是专为多租户
2024-10-30 09:33:30
658
658
NVIDIA Colossus超级计算机集群突破10万颗Hopper GPU
NVIDIA近日宣布,其位于田纳西州孟菲斯市的xAI Colossus超级计算机集群规模已壮大至10万颗NVIDIA Hopper GPU。这一里程碑式的成就,再次彰显了NVIDIA在AI计算领域
2024-10-30 10:29:51
993
993MLCommons推出AI基准测试0.5版
开放式机器学习工程联盟 MLCommons 在美国加州当地时间公布推出适用于消费类 PC 的 AI 性能的 MLPerf Client 基准测试的 0.5 版,这是该测试的第一个公开版本
2024-12-12 16:47:02
1295
1295联发科与NVIDIA合作 为NVIDIA 个人AI超级计算机设计NVIDIA GB10超级芯片
联发科近日宣布与NVIDIA合作设计NVIDIA GB10 Grace Blackwell超级芯片,将应用于NVIDIA 的个人AI超级计算机NVIDIA® Project DIGITS。 联发科在
2025-01-07 16:26:16
883
883NVIDIA推出个人AI超级计算机Project DIGITS
NVIDIA 推出个人 AI 超级计算机 NVIDIA Project DIGITS,全球的 AI 研究员、数据科学家和学生都可获取 NVIDIA Grace Blackwell 平台的强大功能。
2025-01-08 11:03:32
1221
1221MediaTek与NVIDIA携手打造GB10 Grace Blackwell超级芯片
MediaTek近日正式宣布与NVIDIA携手合作,共同设计NVIDIA GB10 Grace Blackwell超级芯片。这款芯片将被应用于NVIDIA的个人AI超级计算机——NVIDIA
2025-01-08 15:32:03
1355
1355MediaTek与NVIDIA携手打造超级芯片
近日,在即将举行的CES2025消费电子展上,MediaTek宣布了一项重大合作——与NVIDIA共同设计NVIDIA GB10 Grace Blackwell超级芯片。这款芯片将应用于NVIDIA
2025-01-10 13:49:03
889
889MediaTek与NVIDIA携手设计GB10 Grace Blackwell超级芯片
MediaTek与NVIDIA近日宣布了一项重要合作,双方将共同设计NVIDIA GB10 Grace Blackwell超级芯片。这款超级芯片将被应用于NVIDIA的个人AI超级计算机
2025-01-13 10:48:16
954
9541.9倍性能提升!英特尔至强6在MLPerf基准测试中表现卓越
与第五代至强处理器相比,英特尔至强6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基准测试结果,其中,英特尔® 至强® 6性能核处理器在本次测试的六个
2025-04-07 10:58:09
558
558NVIDIA技术赋能欧洲最快超级计算机JUPITER
NVIDIA 宣布,搭载 NVIDIA Grace Hopper 平台的 JUPITER 超级计算机成为欧洲最快超级计算机,其运行 HPC 和 AI 工作负载的速度是第二名的两倍以上。
2025-06-12 15:33:36
1209
1209NVIDIA助力AI超级计算机Isambard-AI投入使用
英国布里斯托大学的超级计算机 Isambard-AI 采用 NVIDIA Grace Hopper 超级芯片,其 AI 算力达到了 21 ExaFLOPS,不仅是英国最快的系统,同时也是全球能效最高的系统之一。
2025-07-28 15:07:19
1030
1030MediaTek携手NVIDIA开启个人AI算力新纪元
即将上市的 NVIDIA DGX Spark 个人 AI 超级计算机,搭载 MediaTek 与 NVIDIA 合作设计的 GB10 Grace Blackwell 超级芯片,NVIDIA DGX
2025-10-16 11:26:31
584
584英伟达GH200、特斯拉Dojo超级算力集群,性能爆棚!算力之争加剧!
全球最复杂的生成式 AI 工作负载而构建。 日前,这款GH200 Grace Hopper超级芯片首次亮相MLPerf行业基准测试,在此次测试中,具有更高的内存带宽和更大的内存容量的GH200
2023-09-14 09:10:04
4358
4358
电子发烧友App


评论