Nvidia发布世界最大GPU-电子发烧友网

日前，英伟达GTC 2018（GPU Technology Conference 2018，以下简称GTC）在美国圣何塞举行。英伟达再一次在提升计算力的路上越走越远。GPU产品依然是主旋律，Tesla V100系列、DGX系列和Quadro GPU系列都进行了更新。

新产品—全世界最大的GPU只要399

全新Tesla V100显存将从原来的16GB提升至32GB。2017年5月11日，英伟达正式发布了全新Volta架构GPU——NVIDIA Tesla V100，它拥有超过210亿个晶体管，是上代TeslaP100的1.37倍。它的单精度浮点性能高达15 TFLOPS，双精度浮点7.5 TFLOPS。

基于此前的NVIDIA NVLink架构，英伟达还推出了全新的NVSwitch架构。这一互联架构的带宽比PCle交换机高5倍，足以支持更大规模和复杂的数据集运算，让开发者和科学家可以构建更高级的系统。

基于Tesla V100的升级和全新的NVSwitch架构，英伟达将DGX 2的性能较前一代产品有大幅度提升。

在2016年的GTC上英伟达正式发布DGX 1，它拥有8颗帕斯卡架构GP100核心的Tesla P100 GPU，以及7TB的SSD，由两颗16核心的Xeon E5-2698v3以及512GB的DDR4内存驱动。售价为129000美元。2017年9月份，英伟达推出了一款基于Volta架构的DGX 1V，拥有8块Tesla V100。

而DGX 2应用了最新的NVSwitch架构，通过12个NVSwitch支持16块全新的Tesla V100共享同一的内存空间，总计512 GB HBM2存储，能实现每秒高达2千万次的浮点运算。此外，基于NVSwitch架构的应用，16块GPU可以实现2.4TB/秒的数据传输能力。

DGX 2内含16颗Tesla V100芯片

“这是全球最大的GPU。”黄仁勋表示，他还用“美丽、性感”等词语来形容这一款最新的DGX系列产品。

DGX 2的售价，黄仁勋首先给出的是150万美元，最后直接减价为39.9万美元，将在今年的第三季度正式开放购买。

面向艺术及设计领域，英伟达还推出了搭载了NVIDIA RTX（实时光线追踪）技术的NVIDIA Quadro GV100 GPU。单块GPU拥有32GB内存，可以基于NVLink技术将两块GV100 GPU并联，从而将内存提升至64GB。在前一周的游戏开发者大会上，英伟达正式推出了NVIDIA RTX技术。

GV100 GPU基于最新的Volta架构，可以提供每秒7.4万亿次浮点运算的双精度性能，每秒14.8万亿次浮点运算的单精度性能，以及每秒118.5万亿次浮点运算的深度学习性能。

黄仁勋手中的GV100 GPU

这款产品主要针对传媒娱乐从业者、产品设计师、建筑设计师等专业设计与流媒体专业人员。其中，NVIDIA RTX内置的NVIDIA OpitX AI-denoiser可以实现实时的AI降噪去噪。

硬件之外，英伟达还发布了针对软件的更新——TensorRT 4软件。这一软件可用于优化、验证和部署在超大规模数据中心、嵌入式与汽车GPU平台中经过训练的神经网络。

为了笼络更多的开发者，英伟达与谷歌的工程师将TensorRT集成至谷歌的TensorFlow 1.7中。

自动驾驶—暂停自动驾驶研发

自动驾驶仍在本次GTC的讨论之列

英伟达的自动驾驶平台可以统称为Drive PX系列。但是其实，Drive PX只是NVIDIA车载AI平台的系列名称。而这个系列目前主要包括两代产品：已经量产的Drive PX 2平台，以及在2018年初展示的新一代平台Xavier。

不过黄仁勋却在GTC 2018上宣布英伟达将暂停自动驾驶的研发工作，虽然没有说明何时能再推进这一进程，但是他也表示“不会太久。”

在2018年2月9日对外发布的2018财年第四季度及全年财报中，英伟达曾经提到过与Uber、Aurora合作打造自动驾驶汽车，采用的就是开源的NVIDIA Drive人工智能自动驾驶平台。

美国当地时间3月18日晚上，亚利桑那州一名女子被Uber自动驾驶汽车撞伤，之后不幸身亡。这是全球首例自动驾驶车辆致人死亡的事故，随后Uber宣布将暂停其在美国和加拿大的自动驾驶项目。随后在26日，亚利桑那州州长宣布暂禁Uber在亚利桑那州公路测试自驾车。

黄仁勋在回答媒体关于该案件的提问时表示，英伟达对于这个意外感到悲伤，但是自动驾驶的研究本身是没有错的，应该从这个案件中吸取经验，提升自动驾驶的安全性。作为Uber在自动驾驶领域的合作方之一，英伟达暂停自动驾驶的研发可能和Uber的自动驾驶汽车撞人致死案有关，但其并没有完全放弃自动驾驶项目。

英伟达的DRIVE Constellation仿真系统

英伟达在GTC上推出了针对自动驾驶汽车测试的仿真系统——DRIVE Constellation。

DRIVE Constellation仿真系统是一套使用照片级真实感模拟，基于云的自动驾驶汽车测试系统。它基于两个不同的服务器，第一台服务器运行的是DRIVE Sim软件，可以模拟自动驾驶汽车的传感器，比如摄像头、激光雷达和雷达等。

DRIVE Sim软件可以通过生成照片级的数据流，从而创建不同的测试环境，比如晴天、暴雨、暴雪等不同的天气状况、日间和夜间等不同的光线状况、急转弯或陡坡等不同的路面状况。并且在模拟过程中设置各种危险和突发状况，比如行人突然穿越马路等，以测试自动驾驶汽车的反应能力，以确定其不会对人带来安全威胁。

第二台服务器搭载的是NVIDIA DRIVE Pegasus AI汽车计算平台，运行完整的自动驾驶汽车软件堆栈，并能够处理传感器搜集模拟数据。经过处理的数据会被反馈给传感器，一直进行数据的循环。

从时间来看，英伟达推出的这个仿真系统和Uber的自动驾驶汽车撞人致死案并无太大关联，不过在长远的未来，它将能有效帮助提升自动驾驶汽车测试的安全性。

新合作—与ARM合作布局IoT

英伟达还宣布与ARM达成了合作，共同为全球数十亿台IoT设备提供深度学习的能力。双方将开源的英伟达深度学习加速器整合到ARM的Project Trillium机器学习平台上。

2018年2月23日，ARM推出了Project Trillium项目，这是一套包括新的高度可扩展处理器的ARM IP组合，这些产品可以提供增强的机器学习(ML)和神经网络(NN)功能。当前的技术产品主要针对移动设备市场，将让全新的搭载机器学习功能的设备具有先进的计算能力，包括先进的目标检测功能。

在将英伟达深度学习加速器整合到Project Trillium之后，全球数十亿台的消费电子设备上的IoT芯片将具备机器学习能力。

GTC之外—计算力提升从创新驱动变为需求驱动

提到英伟达和黄仁勋，就不得不提到CPU。在2017年的GTC上，黄仁勋曾声称摩尔定律已经终结，设计人员无法再创造出可以实现更高指令集并行的GPU架构，晶体管数量每年增长50%，但CPU的性能每年仅增长10%。

在演讲中，黄仁勋没有放过任何一次揶揄CPU的机会。不管是更新后的Tesla V100、DGX 2，还是最新发布的GV100 GPU，黄仁勋声称“在提供相同的计算力下，它们都比CPU组成的集群要更节能、高效，占用更少的空间。”

“买得越多，省得越多。”已经成了他的口头禅。然而回归到英伟达本身，其本身的高速增长很大一部分是依赖于市场对图形芯片的巨大需求。

在英伟达公布的2018财年第四季度财报中，虽然数据中心业务同比实现了一倍多的增长达到6.06亿美元。但游戏图形芯片业务的营收达17.4亿美元，同比增长29%，占该季度总营收的一半以上。

“加密货币市场的强劲需求超出了我们的预期。” 英伟达首席财务官科莱特·克雷斯表示，“尽管加密货币对我们业务的总体贡献仍难以量化，但我们认为，其在营收中所比例高于上一季度。”

从产品本身来说， GPU目前只能是不断叠加性能，带来的惊喜越来越少。以DGX系列为例，内含的GPU芯片从4颗变成了8颗，今年从8颗增长到了16颗，改变的只不过是互联的架构。单颗芯片的算力提升越来越难，英伟达的“横向发展”只是另辟蹊径。

不过，英特尔的Nervana芯片，谷歌的TPU（目前只在谷歌内部使用）对于英伟达来说是潜在的竞争对手。有竞争在，更大的惊喜才有可能会到来。

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能，互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括：建立AI智能系统智商评测体系，开展世界人工智能智商评测；开展互联网（城市）云脑研究计划，构建互联网（城市）云脑技术和企业图谱，为提升企业，行业与城市的智能水平服务。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
4991

浏览量
103142
gpu

gpu

+关注

关注
28

文章
4742

浏览量
128982
人工智能

人工智能

+关注

关注
1791

文章
47336

浏览量
238721

原文标题：Nvidia黄仁勋发布了全球最大GPU

文章出处：【微信号：AItists，微信公众号：人工智能学家】欢迎添加关注！文章转载请注明出处。

借助NVIDIA GPU提升鲁班系统CAE软件计算效率

本案例中鲁班系统高性能 CAE 软件利用 NVIDIA 高性能 GPU，实现复杂产品的快速仿真，加速产品开发和设计迭代，缩短开发周期，提升产品竞争力。

发表于 12-27 16:24 •131次阅读

《CST Studio Suite 2024 GPU加速计算指南》

《GPU Computing Guide》是由Dassault Systèmes Deutschland GmbH发布的有关CST Studio Suite 2024的GPU计算指南。涵盖GP

发表于 12-16 14:25

NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

NVIDIA Spectrum-X 使基于 NVIDIA Hopper 十万卡 GPU 的巨型系统成为可能 2024 年 10 月 28 日 —NVIDIA 宣布，xAI 位于

发表于 10-30 09:33 •158次阅读

AMD与NVIDIA GPU优缺点

在图形处理单元（GPU）市场，AMD和NVIDIA是两大主要的竞争者，它们各自推出的产品在性能、功耗、价格等方面都有着不同的特点和优势。一、性能 GPU的性能是用户最关心的指标之一。在高端市场

发表于 10-27 11:15 •738次阅读

暴涨预警！NVIDIA GPU供应大跳水

gpu

jf_02331860
发布于 :2024年07月26日 09:41:42

新款Nvidia Titan GPU正在开发中？或将击败未发布的RTX 5090

ABSTRACT摘要最近有消息透露，NVIDIA正在开发一款名为TITANAI的新显卡。该显卡基于即将推出的BlackwellGPU。在Nvidia选择不发布其RTX40系列

发表于 07-26 08:26 •513次阅读

NVIDIA全面转向开源GPU内核模块

借助 R515 驱动程序，NVIDIA 于 2022 年 5 月发布了一套开源的 Linux GPU 内核模块，该模块采用双许可证，即 GPL 和 MIT 许可。初始版本主要面向数据中心计算

发表于 07-25 09:56 •436次阅读

NVIDIA推出两款基于NVIDIA Ampere架构的全新台式机GPU

两款 NVIDIA Ampere 架构 GPU 为工作站带来实时光线追踪功能和生成式 AI 工具支持。

发表于 04-26 11:25 •629次阅读

利用NVIDIA组件提升GPU推理的吞吐

本实践中，唯品会 AI 平台与 NVIDIA 团队合作，结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）将推理的稠密网络和热 Embedding 全置于

发表于 04-20 09:39 •738次阅读

RTX 5880 Ada Generation GPU与RTX™ A6000 GPU对比

NVIDIA RTX™ 5880 Ada Generation GPU 是目前国内重量级 GPU，基于全新 NVIDIA Ada Lovelace 架构构建，采用 4nm 制成工艺，拥

发表于 04-19 10:20 •1850次阅读

NVIDIA 发布全新交换机，全面优化万亿参数级 GPU 计算和 AI 基础设施

NVIDIA 软件实现了跨 Blackwell GPU、新交换机和 BlueField-3 SuperNIC 的分布式计算，大幅提升了 AI、数据处理、高性能计算和云工作负载的性能美国加利福尼亚州

发表于 03-19 10:05 •346次阅读

NVIDIA将在今年第二季度发布Blackwell架构的新一代GPU加速器“B100”

根据各方信息和路线图，NVIDIA预计会在今年第二季度发布Blackwell架构的新一代GPU加速器“B100”。

发表于 03-04 09:33 •1339次阅读

NVIDIA的Maxwell GPU架构功耗不可思议

整整10年前的2013年2月19日，NVIDIA正式推出了新一代Maxwell GPU架构，它有着极高的能效，出场方式也非常特别。

发表于 02-19 16:39 •1037次阅读

巨头豪购35万块NVIDIA最强GPU H100

NVIDIA AI GPU无疑是当下的硬通货，从科技巨头到小型企业都在抢。

发表于 01-29 09:58 •1108次阅读

如何选择NVIDIA GPU和虚拟化软件的组合方案呢？

NVIDIA vGPU 解决方案能够将 NVIDIA GPU 的强大功能带入虚拟桌面、应用程序和工作站，加速图形和计算，使在家办公或在任何地方工作的创意和技术专业人员能够访问虚拟化工作空间。

发表于 01-12 09:26 •1142次阅读