日前,英伟达GTC 2018(GPU Technology Conference 2018,以下简称GTC)在美国圣何塞举行。英伟达再一次在提升计算力的路上越走越远。GPU产品依然是主旋律,Tesla V100系列、DGX系列和Quadro GPU系列都进行了更新。
新产品—全世界最大的GPU只要399
全新Tesla V100显存将从原来的16GB提升至32GB。2017年5月11日,英伟达正式发布了全新Volta架构GPU——NVIDIA Tesla V100,它拥有超过210亿个晶体管,是上代TeslaP100的1.37倍。它的单精度浮点性能高达15 TFLOPS,双精度浮点7.5 TFLOPS。
基于此前的NVIDIA NVLink架构,英伟达还推出了全新的NVSwitch架构。这一互联架构的带宽比PCle交换机高5倍,足以支持更大规模和复杂的数据集运算,让开发者和科学家可以构建更高级的系统。
基于Tesla V100的升级和全新的NVSwitch架构,英伟达将DGX 2的性能较前一代产品有大幅度提升。
在2016年的GTC上英伟达正式发布DGX 1,它拥有8颗帕斯卡架构GP100核心的Tesla P100 GPU,以及7TB的SSD,由两颗16核心的Xeon E5-2698v3以及512GB的DDR4内存驱动。售价为129000美元。2017年9月份,英伟达推出了一款基于Volta架构的DGX 1V,拥有8块Tesla V100。
而DGX 2应用了最新的NVSwitch架构,通过12个NVSwitch支持16块全新的Tesla V100共享同一的内存空间,总计512 GB HBM2存储,能实现每秒高达2千万次的浮点运算。此外,基于NVSwitch架构的应用,16块GPU可以实现2.4TB/秒的数据传输能力。
DGX 2内含16颗Tesla V100芯片
“这是全球最大的GPU。”黄仁勋表示,他还用“美丽、性感”等词语来形容这一款最新的DGX系列产品。
DGX 2的售价,黄仁勋首先给出的是150万美元,最后直接减价为39.9万美元,将在今年的第三季度正式开放购买。
面向艺术及设计领域,英伟达还推出了搭载了NVIDIA RTX(实时光线追踪)技术的NVIDIA Quadro GV100 GPU。单块GPU拥有32GB内存,可以基于NVLink技术将两块GV100 GPU并联,从而将内存提升至64GB。在前一周的游戏开发者大会上,英伟达正式推出了NVIDIA RTX技术。
GV100 GPU基于最新的Volta架构,可以提供每秒7.4万亿次浮点运算的双精度性能,每秒14.8万亿次浮点运算的单精度性能,以及每秒118.5万亿次浮点运算的深度学习性能。
黄仁勋手中的GV100 GPU
这款产品主要针对传媒娱乐从业者、产品设计师、建筑设计师等专业设计与流媒体专业人员。其中,NVIDIA RTX内置的NVIDIA OpitX AI-denoiser可以实现实时的AI降噪去噪。
硬件之外,英伟达还发布了针对软件的更新——TensorRT 4软件。这一软件可用于优化、验证和部署在超大规模数据中心、嵌入式与汽车GPU平台中经过训练的神经网络。
为了笼络更多的开发者,英伟达与谷歌的工程师将TensorRT集成至谷歌的TensorFlow 1.7中。
自动驾驶—暂停自动驾驶研发
自动驾驶仍在本次GTC的讨论之列
英伟达的自动驾驶平台可以统称为Drive PX系列。但是其实,Drive PX只是NVIDIA车载AI平台的系列名称。而这个系列目前主要包括两代产品:已经量产的Drive PX 2平台,以及在2018年初展示的新一代平台Xavier。
不过黄仁勋却在GTC 2018上宣布英伟达将暂停自动驾驶的研发工作,虽然没有说明何时能再推进这一进程,但是他也表示“不会太久。”
在2018年2月9日对外发布的2018财年第四季度及全年财报中,英伟达曾经提到过与Uber、Aurora合作打造自动驾驶汽车,采用的就是开源的NVIDIA Drive人工智能自动驾驶平台。
美国当地时间3月18日晚上,亚利桑那州一名女子被Uber自动驾驶汽车撞伤,之后不幸身亡。这是全球首例自动驾驶车辆致人死亡的事故,随后Uber宣布将暂停其在美国和加拿大的自动驾驶项目。随后在26日,亚利桑那州州长宣布暂禁Uber在亚利桑那州公路测试自驾车。
黄仁勋在回答媒体关于该案件的提问时表示,英伟达对于这个意外感到悲伤,但是自动驾驶的研究本身是没有错的,应该从这个案件中吸取经验,提升自动驾驶的安全性。作为Uber在自动驾驶领域的合作方之一,英伟达暂停自动驾驶的研发可能和Uber的自动驾驶汽车撞人致死案有关,但其并没有完全放弃自动驾驶项目。
英伟达的DRIVE Constellation仿真系统
英伟达在GTC上推出了针对自动驾驶汽车测试的仿真系统——DRIVE Constellation。
DRIVE Constellation仿真系统是一套使用照片级真实感模拟,基于云的自动驾驶汽车测试系统。它基于两个不同的服务器,第一台服务器运行的是DRIVE Sim软件,可以模拟自动驾驶汽车的传感器,比如摄像头、激光雷达和雷达等。
DRIVE Sim软件可以通过生成照片级的数据流,从而创建不同的测试环境,比如晴天、暴雨、暴雪等不同的天气状况、日间和夜间等不同的光线状况、急转弯或陡坡等不同的路面状况。并且在模拟过程中设置各种危险和突发状况,比如行人突然穿越马路等,以测试自动驾驶汽车的反应能力,以确定其不会对人带来安全威胁。
第二台服务器搭载的是NVIDIA DRIVE Pegasus AI汽车计算平台,运行完整的自动驾驶汽车软件堆栈,并能够处理传感器搜集模拟数据。经过处理的数据会被反馈给传感器,一直进行数据的循环。
从时间来看,英伟达推出的这个仿真系统和Uber的自动驾驶汽车撞人致死案并无太大关联,不过在长远的未来,它将能有效帮助提升自动驾驶汽车测试的安全性。
英伟达还宣布与ARM达成了合作,共同为全球数十亿台IoT设备提供深度学习的能力。双方将开源的英伟达深度学习加速器整合到ARM的Project Trillium机器学习平台上。
2018年2月23日,ARM推出了Project Trillium项目,这是一套包括新的高度可扩展处理器的ARM IP组合,这些产品可以提供增强的机器学习(ML)和神经网络(NN)功能。当前的技术产品主要针对移动设备市场,将让全新的搭载机器学习功能的设备具有先进的计算能力,包括先进的目标检测功能。
在将英伟达深度学习加速器整合到Project Trillium之后,全球数十亿台的消费电子设备上的IoT芯片将具备机器学习能力。
GTC之外—计算力提升从创新驱动变为需求驱动
提到英伟达和黄仁勋,就不得不提到CPU。在2017年的GTC上,黄仁勋曾声称摩尔定律已经终结,设计人员无法再创造出可以实现更高指令集并行的GPU架构,晶体管数量每年增长50%,但CPU的性能每年仅增长10%。
在演讲中,黄仁勋没有放过任何一次揶揄CPU的机会。不管是更新后的Tesla V100、DGX 2,还是最新发布的GV100 GPU,黄仁勋声称“在提供相同的计算力下,它们都比CPU组成的集群要更节能、高效,占用更少的空间。”
“买得越多,省得越多。”已经成了他的口头禅。然而回归到英伟达本身,其本身的高速增长很大一部分是依赖于市场对图形芯片的巨大需求。
在英伟达公布的2018财年第四季度财报中,虽然数据中心业务同比实现了一倍多的增长达到6.06亿美元。但游戏图形芯片业务的营收达17.4亿美元,同比增长29%,占该季度总营收的一半以上。
“加密货币市场的强劲需求超出了我们的预期。” 英伟达首席财务官科莱特·克雷斯表示,“尽管加密货币对我们业务的总体贡献仍难以量化,但我们认为,其在营收中所比例高于上一季度。”
从产品本身来说, GPU目前只能是不断叠加性能,带来的惊喜越来越少。以DGX系列为例,内含的GPU芯片从4颗变成了8颗,今年从8颗增长到了16颗,改变的只不过是互联的架构。单颗芯片的算力提升越来越难,英伟达的“横向发展”只是另辟蹊径。
不过,英特尔的Nervana芯片,谷歌的TPU(目前只在谷歌内部使用)对于英伟达来说是潜在的竞争对手。有竞争在,更大的惊喜才有可能会到来。
未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
-
NVIDIA
+关注
关注
14文章
4848浏览量
102705 -
gpu
+关注
关注
28文章
4673浏览量
128558 -
人工智能
+关注
关注
1789文章
46636浏览量
236989
原文标题:Nvidia黄仁勋发布了全球最大GPU
文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论