0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动驾驶到底需耗费多少算力?GPU碾压CPU,NVIDIA超车英特尔已成定局?

高工智能汽车 来源:未知 作者:李倩 2018-06-14 10:40 次阅读

自动驾驶所需要的计算力,是过去任何一台计算机都没有达到过的。” NVIDIA的掌门人黄仁勋曾在公开场合不止一次的说过这句话。

这句话背后,还有另一层意思。2010年之后,GPU处理器内部的晶体管数量还保持着快速增长的势头,而CPU已经出现了明显的放缓。

“摩尔定律已经终结,晶体管数每年增长50%,但CPU的性能每年仅增长10%,设计人员无法再创造出可以实现更高指令级并行性的CPU架构。”在2017年的GTC China上,NVIDIA的掌门人黄仁勋如是说。

NVIDIA是一家研发生产GPU的公司,对GPU自然有区别于他人的崇拜,捧GPU贬CPU可以理解。但,摩尔定律确实失效了。

NVIDIA是一家传统消费电子厂商,但在汽车领域也不是完全的新手。早在2005年,NVIDIA就开发了用于3D导航信息系统的Tegra处理器,2011年用在了奥迪A8豪华车型上。

到目前为止,NVIDIA的汽车电子业务占该公司47亿美元销售额的4%。2015年,NVIDIA发布了针对自动驾驶的DRIVE PX系列,开启了自动驾驶领域的驰骋,一时也成为了市场宠儿,股价扶摇直上。

支撑起这一切的,是NVIDIAGPU给自动驾驶带来的想象——DRIVE PX运算力强大,是自动驾驶必备的运算力平台。这正应验了黄教主开头所说的话,此话不仅被竞争对手英特尔听了去,同时也被股民听了去。

那么,自动驾驶到底需耗费多少算力?谁是算力的最大消耗者?GPU碾压CPU,NVIDIA超车英特尔已成定局?

视觉处理是大头

自动驾驶的实现,需要依赖感知传感器对道路环境的信息进行采集,包括超声波、摄像头、毫米波雷达、激光雷达等,采集的好的数据需要传送到汽车中央处理器进行处理,用来识别障碍物、可行道路等,最后依据识别的结果,规划路径、制定速度,自动驱使汽车行驶。

整个过程需要在瞬时完成,延时必须要控制在毫秒甚至微秒级别,才能保证自动驾驶的行驶安全。

要完成瞬时处理、反馈、决策规划、执行的效果,对中央处理器的算力要求非常高。

最直观的体现,便是用于感知道路环境的摄像头,通常密布车身,数量在12个左右,为了识别障碍物,处理器需要对多路摄像头实时拍摄的数据进行解析,而单颗1080P的高清摄像头每秒可以产生超过1G的数据,数据量不可谓不大。而为了准确识别图像、视频中的有效信息,业内多采用深度学习神经网络

深度学习神经网络尤其是几百上千层的神经网络对高性能计算要求非常高,GPU对处理复杂运算拥有天然的优势:它有出色的并行矩阵计算能力,对于神经网络的训练和分类都可以提供显著的加速效果。

适用于自动巡航功能的 NVIDIA DRIVE PX 2 计算平台采用新型单处理器配置,功率仅为 10 瓦,可以帮助车辆利用深度神经网络处理来自多个摄像头和传感器的数据,运算力达到了24 Tops。

Tops(Terra Operations per second)是一个单位,意为每秒运算10^12次,也称万亿次。这种说法通常用于表示处理器的运算力。

但汽车是一个终端,对功耗要求苛刻,因此根据TI的官方报告,通常对效率、功耗、算力要求较高的时候,对运算力的表述更为贴切的是GOPS/W of TOPS/W,即消耗单位瓦数可以完成多少运算量。

业内人士表示,在自动驾驶中,最耗费算力的当属视觉处理,占到全部算力需求的一半以上。而图像处理是GPU的强项,CPU并不占优势,这一点已经在传统领域得到了验证。

Mobileye的ADAS霸业

那么视觉处理中,不同等级自动驾驶中对算力的要求有什么区别?每一家公司在权衡之后,选择特定的视觉芯片方案有什么原因?Minieye的CEO刘国清在面对《高工智能汽车》的提问时表示,这是一个业内人士都知但不为外人道的话题

嗯,听起来很神秘,但想要找到答案其实也并不难。

Mobileye是自动驾驶领域视觉处理最领先的公司(这是基于其市场占有率以及车载领域的经验而言)。

从2004年开始,Mobileye相继推出了EyeQ系列的视觉处理芯片,2010年上市的EyeQ2算力为 0.026Tops,功耗2.5w,支持L1的功能;2014年发布的EyeQ3每秒浮点运算为0.256万亿次,功耗为2.5w,支持L2;2015年发布EyeQ4每秒浮点运算可达2.5万亿次,功耗为3w,最高可支持L3;EyeQ5计划于2020年量产,单颗芯片的浮点运算能力为12Tops,TDP是5W。

Mobileye通过EyeQ芯片,驱动单颗摄像头,可以采集路面信息,对周围环境进行精细解读,实现前碰撞预警(FCW)、前方车距监测与预警系统(HMW)、车道偏离预警系统(LDW)、行人探测与防撞系统(PCW)、城市前碰撞警告 (UUFCW 与智能远光灯控制系统(IHC)等功能,准确预测前方道路可以出现的障碍和危险。

其识别准确率达99.99%,到目前为止,已有超过千万的出货量,占市场份额超过70%。特斯拉的AutoPilot 1.0的硬件方案就选用了Mobileye的EyeQ3。

Mobileye通过使用专有的计算cores(加速器)实现功耗 - 性能成本目标,这些cores专门针对各种计算机视觉信号处理和机器学习任务进行了优化,其中包括深度神经网络。

这些加速器内核专为满足ADAS和自动驾驶市场的需求而设计。每个EyeQ ®芯片具有异质的,完全可编程的加速器; 每种加速器类型都针对其自己的算法系列进行了优化。

加速器体系结构的多样性使应用程序能够通过为每项任务使用最合适的内核来节省计算时间和芯片功耗。优化任务cores的分配从而保证了EyeQ ® 在低功耗范围内提供“超级计算机”功能,实现高性价比的被动散热。

Mobileye的core是包含一组工作在1GHZ的工业级四核MIPS处理器,支持多线程技术能更好的进行数据的控制和管理; 多个专用的向量微码处理器(VMP(Vector Microcode Processor,俗称VMP)),用来应对ADAS相关的图像处理任务(如:缩放和预处理、翘曲、跟踪、车道标记检测、道路几何检测、滤波和直方图等);一颗军工级MIPS Warrior CPU位于次级传输管理中心,用于处理片内片外的通用数据。

自动驾驶算力之争,NVIDIA领衔

Autopilot 2.0 使用了Drive PX2,DRIVE PX 2有多个版本,AutoCruise,搭载一颗Tegra Parker,主要支持高速公路自动驾驶和高精地图绘制的计算;AutoChauffeur,搭载2颗Tegra Parker和2颗独立的Pascal架构GPU,支持点到点的自动驾驶;Fully Autonomous Driving,由多套Drive PX2组成的计算矩阵。

NVIDIA2015年推出了Drive PX系列,第一代Drive PX搭载TegraX1处理器和10GB内存,能够同时处理12个200万像素摄像头每秒60帧的拍摄图像,单浮点计算能力为2Tops,深度学习计算能力为2.3Tops,可支持L2高级辅助驾驶计算需求。

2016年发布的Drive PX2,单精度计算能力达到8TFlops,深度学习计算能力达24Tops,TDP达250W,可满足L3级别的自动驾驶需求。

Drive PX2采用16nm FinFET工艺,TDP 250W,支持12路摄像头输入、激光定位、雷达和超声波传感器。

它的目的是通过NVIDIA DIGITS打造一套车辆的深度学习训练平台,让每辆安装Drive PX2的车辆都成为都成为NVIDIA DRIVENet深度神经网络一部分,它将包括3个卷积码层,3700万个神经元。传说如果一条信息要在整个网络流经一次,将会产生400亿次操作。

根据黄仁勋在BCW 2017的表述,Drive PX2的方案是针对L3的方案(作为参考的是奥迪A8推出的有限场景下的L3级自动驾驶,采用的ZF ProAI正是使用了NVIDIA Tegra K1 SoC,及Drive PX2 AutoCruise版本,当然负责视觉处理的还是Mobileye的EyeQ3),而Xavier则是针对L4的方案,Xavier的运算力达到了1Tops/W。Drive Xavier于2018年发布,算力可达30Tops,TDP为30W。

到目前为止,黄教主给L3、L4级别的自动驾驶算力,列出了自己心目中的标准。这一标准由于标新立异,还未有人敢质疑。

自动驾驶公司在进行新项目的研发时,也往往以NVIDIA的开发板为首。传统的芯片巨头英特尔,在巨资收购Mobileye后,心里还不踏实,因为Mobileye一直针对的是ADAS,其量产的EyeQ3芯片0.256Tops的算力,跟NVIDIA PX2的8/24Tops相比,似乎差了一个时代。

算力的焦虑在困扰着Inter这个巨头,自动驾驶公司同样也不轻松,开发中可以使用NVIDIA打底,量产方案却少有人尝鲜。

这一方面是源于价高非车规级,另一方面NVIDIA也需要汽车市场的验证。另一头Mobileye的EyeQ系列,基本为自用,不放心外人擅自开发,NVIDIA和Mobileye的分手据传也缘起于此。

那么,留给自动驾驶公司的芯片方案,还有哪些呢?市场应声者寥寥无几,NXP高通英飞凌等公司,推出的都是针对较低自动驾驶等级的ADAS芯片方案,目前一些有量产项目的ADAS公司,采用的也多是这些传统车载芯片领域厂商的产品。这些厂商之间的方案有什么异同?留待下一篇文章再述吧~

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4765

    浏览量

    100584
  • NVIDIA
    +关注

    关注

    14

    文章

    4949

    浏览量

    102840
  • 自动驾驶
    +关注

    关注

    783

    文章

    13700

    浏览量

    166180

原文标题:自动驾驶的算力之争,谁在孤独求败? | GGAI视角

文章出处:【微信号:ilove-ev,微信公众号:高工智能汽车】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    标贝科技:自动驾驶中的数据标注类别分享

    自动驾驶训练模型的成熟和稳定离不开感知技术的成熟和稳定,训练自动驾驶感知模型需要使用大量准确真实的数据。据英特尔计算,L3+级自动驾驶每辆汽车每天产生的数据高达4000GB,作为
    的头像 发表于 11-22 15:07 787次阅读
    标贝科技:<b class='flag-5'>自动驾驶</b>中的数据标注类别分享

    标贝科技:自动驾驶中的数据标注类别分享

    自动驾驶训练模型的成熟和稳定离不开感知技术的成熟和稳定,训练自动驾驶感知模型需要使用大量准确真实的数据。据英特尔计算,L3+级自动驾驶每辆汽车每天产生的数据高达4000GB,作为
    的头像 发表于 11-22 14:58 158次阅读
    标贝科技:<b class='flag-5'>自动驾驶</b>中的数据标注类别分享

    英特尔12月或发布Battlemage GPU芯片

    近日,有关英特尔即将在12月发布全新Battlemage GPU芯片的传闻再次被证实。据硬件挖掘者和泄密者Tomasz Gawrońsk分享的预告图显示,英特尔极有可能在AMD RDNA 4和英伟达Blackwell之前,率先推
    的头像 发表于 11-19 17:37 344次阅读

    Inflection AI转向英特尔Gaudi 3,放弃英伟达GPU

    近日,人工智能技术公司Inflection AI宣布了一项重要决策,其最新的企业平台将放弃采用英伟达(Nvidia)的GPU,转而选择英特尔的Gaudi 3加速器。
    的头像 发表于 10-10 17:21 446次阅读

    英特尔酝酿出售Mobileye股权以应对挑战

    面对全球科技行业的持续变革与自身业务的战略调整,英特尔公司(Intel)正考虑对其自动驾驶系统领域的核心资产——Mobileye Global进行部分股权的出售。这一举措标志着英特尔在全面审视其业务版图后,可能采取的重大财务与战
    的头像 发表于 09-06 16:31 423次阅读

    英特尔下代 CPU 还值得信任吗?

    市场竞争加剧和技术迭代加速,英特尔面临着前所未有的挑战。在这样的背景下,我们不禁要问:英特尔下一代CPU是否还值得我们的信任?
    的头像 发表于 09-04 13:57 304次阅读
    <b class='flag-5'>英特尔</b>下代 <b class='flag-5'>CPU</b> 还值得信任吗?

    FPGA在自动驾驶领域有哪些优势?

    FPGA(Field-Programmable Gate Array,现场可编程门阵列)在自动驾驶领域具有显著的优势,这些优势使得FPGA成为自动驾驶技术中不可或缺的一部分。以下是FPGA在自动驾驶
    发表于 07-29 17:11

    FPGA在自动驾驶领域有哪些应用?

    FPGA(Field-Programmable Gate Array,现场可编程门阵列)在自动驾驶领域具有广泛的应用,其高性能、可配置性、低功耗和低延迟等特点为自动驾驶的实现提供了强有力的支持。以下
    发表于 07-29 17:09

    英特尔确认Ponte Vecchio GPU将以云服务形式推出

    英特尔在公告中强调,随着AI技术需求的不断增加,公司重点利用Gaudi AI加速器的性能优势及有竞争的价格,实现其迅速拓展。同时,至强系列CPU依然是HPC解决方案的首选,而数据中心GPU
    的头像 发表于 05-18 17:14 1028次阅读

    未来已来,多传感器融合感知是自动驾驶破局的关键

    /L4级自动驾驶赛跑的元年。 马斯克评论FSD 12.3版本的左转弯操作就像人类司机一样。如果FSD 12.3版本成功,将基本颠覆目前市场上的智能驾驶技术路线。基于“数据/算法/算”的无人
    发表于 04-11 10:26

    英特尔五款优秀的CPU介绍

    尽管英特尔曾经声称这是世界上第一个 16 位 CPU,但事实并非如此,事实上,英特尔正在追赶德州仪器 (Texas Instruments) 等公司,后者更早推出了 16 位芯片。
    发表于 03-18 10:19 897次阅读

    m3芯片相当于英特尔几代cpu m3芯片相当于英特尔什么显卡

    m3芯片相当于英特尔几代cpu 关于m3芯片相当于英特尔几代cpu的问题,实际上并没有一个准确的答案,因为不同的芯片制造商与英特尔
    的头像 发表于 03-11 18:13 1.3w次阅读

    英特尔旗下自动驾驶公司发布DXP操作系统

    英特尔旗下自动驾驶技术公司Mobileye Global在CES 2024上推出了一款名为DXP的操作系统,旨在帮助汽车制造商开发特定的自动驾驶系统。这款新系统的推出,引发了Mobileye股价的上涨,盘中涨幅约3%。
    的头像 发表于 01-10 14:47 717次阅读

    CPU如何加速AI部署与应用?第五代英特尔® 至强® 给你支招!

    属于各自所有者资产。 12月15日|2023英特尔新品发布会暨AI技术创新派对等你来! 平台赋能,算共建,智贯东西 “2023 英特尔大会暨东数西算大会”成功举办 2023
    的头像 发表于 12-16 16:15 504次阅读
    <b class='flag-5'>CPU</b>如何加速AI部署与应用?第五代<b class='flag-5'>英特尔</b>® 至强® 给你支招!

    英特尔:玻璃基板将推动算提升

    的应用的算需求。        虽然玻璃基板对整个半导体行业而言并不陌生,但凭借庞大的制造规模和优秀的技术人才,英特尔将其提升到了一个新的水平。近日,英特尔封装测试技术开发(Assembly Test Technology D
    的头像 发表于 12-06 09:31 423次阅读