0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ADS2.0算法演进与对算力的新需求

佐思汽车研究 来源:佐思汽车研究 作者:Dr. Luo 2022-06-14 11:13 次阅读

爱因斯坦有曰,“瀚宇初开,万物当生也。万物可谓振动,能光旋律之荡漾焉。”(注:作者中译)。AI新技术革命时代,大算力芯片也拨响了自动驾驶ADS的琴弦。大珠小珠般的AI算法在大算力驱动下应运而振,应时而动,解决了ADS从L2到L5逐级演进中的众多技术难题。ADS每增加一级,算力需求也会呈现十倍速上升,L4级别可预计的算力需求在1000TOPS,L5级别估计在2000-10000TOPS。如图1所示,后摩尔时代工艺更新性能提升放缓,延续性创新的边际效益递减,新兴的大算力架构在不断涌现,加上驾驶AI算法高速迭代演进,在未来5-10年内可能会为后来的技术追赶者提供非常奇妙的一个直线超车的机会窗口。

8f14599e-eb8f-11ec-ba43-dac502259ad0.png

图1. 大算力时代自动驾驶ADS领域的机遇与挑战

当前ADS自动驾驶采用决策层后融合的方式,其局限性主要表现在在极端恶劣气候与复杂遮挡等不确定性场景下分别进行单模结构化信息提取后再进行融合决策,每个通道信息会有不同层面丢失,很难能够进行多模有效互补与特征提取共享,算力内卷且性能远低于预期。 未来ADS算法会进入一个全新的2.0阶段,4D空间下基于时空的多模感知与融合推理, 也就是特征提取/统计推断/应急预测相结合,实现在动态复杂的有噪声干扰等场景下,全程安全无碰撞的高效行驶。挑战可以体现在,动态随机的人车物交互,多变天气路况,以及突发交通事件等。

ADS算法2.0从决策层后融合走向特征级前融合,当前行业ADS2.0算法主要演进方向为:

多模感知:主要是针对Camera/LiDAR/Radar海量数据流进行特征提取,DL网络主流趋势是卷积CNN或者贝叶斯NN+Transformer的组合架构,在统一的特征空间实现多模感知,特征融合共享以及多任务来提升算力的整体效率。

融合推理:主要是基于模型与基于数据的双学习模式,DL网络主流趋势是基于目标交互GNN或基于统计模型的贝叶斯RL强化学习或On-Policy应急学习,实现ADS安全可信的预测规划与控制。

ADS2.0算法演进与对算力的新需求,可以总结为:

演进趋势1:感知定位预测决策控制模块化处理流程中, 从决策层后融合走向感知层前融合,算法能够在统一空间支持多模融合,多任务共享;

演进趋势2:预测与规划联合建模,从可获得的Off-policy数据进行学习,能够自学习处理不确定性下的安全性问题,解决可解释问题,持续学习解决新场景问题;

算力新需求:从compute-bound(矩阵-矩阵乘)走向memory-bound(矩阵-矢量乘),从偏计算走向偏存取。

当前市场上主流算力NPU芯片,都存在几个共性问题,一是算法效率低,多数只针对CNN(例如3x3卷积)优化;二是内存墙问题:处理单元PE存算分离,数据共享难;三是能耗墙问题:数据重复搬移,耗能增加>30-70%。所以,当前针对某些特定算法的芯片,无法解决未来ADS 2.0的需求。

从工程实践上看,ADS 2.0算法需通过“硬件预埋,算法迭代,算力均衡”,提供一个向前兼容的解决方案,以通用大算力(CPU的5-10倍性能提升,NPU的100-500倍性能提升)来解决未来不确定性的算法演进:

底层架构的演进:从存算分离过渡到近内存计算,最终走向内存计算;

数据通道与模型:高速数据接口;数据压缩+模型压缩+低精度逼近计算+稀疏计算加速;

并行的顶层架构:模型-硬件联合设计,以及硬设计可配置+硬件调度+软运行可编程调度引擎。

未来,自动驾驶算法不会止步于ADS 2.0,而能够真正支持人类自动驾驶梦想的算法ADS 3.0趋势,我们估计会采用一个DNN网络来进行端到端学习。设想一下,有足够的专家驾驶数据用来做模仿学习或采用RL自学习模式,可以有效降低数据标注的信息瓶颈与严重依赖,从而能够从多模多样化数据层面进行非直接的推理或者博弈类的对抗学习。ADS 3.0目前来看模型的可信与可解释程度依然远低于预期。ADS系统的总体演进趋势,可以总结为:

场景演进:负载多样性

➤从数量有限的摄像头设置走向 Camera + LiDAR + Radar 多模态组合。

趋势演进:算法多样性

➤从CNN+Rule-based方案走向CNN, RNN,Transformer, GNN, Bayesian, Deep ReinforcementLearning, Dynamic DNN, NAS Generated DNN, Variably Quantized DNN多算法组合。

大算力时代,ADS系统首先是模仿人类的驾驶行为,通过注意力机制,期望在感知定位预测规划控制领域提供远超人类的决策能力。这需要我们在AI的三要素(算法、算力、数据)基础上添加第四要素,知识或者常识。

8f88890e-eb8f-11ec-ba43-dac502259ad0.png

而上述要素,均需要在充分理解算法的快速迭代的大趋势下,拥有充足的超大通用算力,ADS系统在离线模仿学习人类驾驶先验知识经验与规则的基础上,能够提供在线自主学习能力,通过自学习激励与博弈共赢策略应对众多不确定性的人机交互的复杂环境,能够对决策不充分的场景下做到安全应对和提供可信解释能力。此外,大算力芯片也需要能够通过额外的算力,对芯片内百万级的并行计算单元提供故障检测与安全规避能力,对大量多模传感器的部分或者完全失效进行有效检测与应对决策处理,对驾驶环境针对传感器的主动攻击与外界目标非主动干扰进行有效检测与实时决策处理。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4633

    浏览量

    93478
  • ADS1220
    +关注

    关注

    24

    文章

    488

    浏览量

    125254
  • 自动驾驶
    +关注

    关注

    785

    文章

    13957

    浏览量

    167262

原文标题:自动驾驶行业快速迭代演变的算法和算力浅论

文章出处:【微信号:zuosiqiche,微信公众号:佐思汽车研究】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    中心的如何衡量?

    作为当下科技发展的重要基础设施,其的衡量关乎其能否高效支撑人工智能、大数据分析等智能应用的运行。以下是对智中心算衡量的详细阐述:一、
    的头像 发表于 01-16 14:03 626次阅读
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    科技云报到:要更要“利”,“精装”触发大模型产业新变局?

    科技云报到:要更要“利”,“精装”触发大模型产业新变局?
    的头像 发表于 01-16 10:24 149次阅读

    澎峰科技助力中国移动 重磅发布智“芯合”原生基础软件栈2.0

    原生基础软件栈2.0。 芯片是智生态的基石,基础软件栈是智生态的核心。澎峰科技凭借在高性能计算库和跨架构领域的深厚积累,自
    的头像 发表于 12-03 15:08 374次阅读
    澎峰科技助力中国移动 重磅发布智<b class='flag-5'>算</b>“芯合”<b class='flag-5'>算</b><b class='flag-5'>力</b>原生基础软件栈<b class='flag-5'>2.0</b>

    澎峰科技助力中国移动发布智“芯合”原生基础软件栈2.0

    近日 ,由中国通信学会主办、中国移动研究院承办的2024中国信息通信大会“网络网一体创新发展论坛 ”在成都召开。中国移动研究院携手澎峰科技等产业合作伙伴在本次论坛重磅发布了智
    的头像 发表于 12-03 13:29 331次阅读

    企业AI租赁是什么

    企业AI租赁是指企业通过互联网向专业的提供商租用所需的计算资源,以满足其AI应用的需求。以下是对企业AI
    的头像 发表于 11-14 09:30 1301次阅读

    GPU开发平台是什么

    随着AI技术的广泛应用,需求呈现出爆发式增长。AI租赁作为一种新兴的服务模式,正逐渐成为企业获取
    的头像 发表于 10-31 10:31 291次阅读

    大模型时代的需求

    现在AI已进入大模型时代,各企业都争相部署大模型,但如何保证大模型的,以及相关的稳定性和性能,是一个极为重要的问题,带着这个极为重要的问题,我需要在此书中找到答案。
    发表于 08-20 09:04

    摩尔线程张建中:以国产助力数智世界,满足大模型需求

    摩尔线程创始人兼CEO张建中在会上透露,为了满足国内对AI的迫切需求,他们正在积极寻求与国内顶尖科研机构的深度合作,共同推动更大规模的AI智集群项目。
    的头像 发表于 05-10 16:36 1057次阅读

    力系列基础篇——101:从零开始了解

    相信大家已经感受到,我们正处在一个人工智能时代。如果要问在人工智能时代最重要的是什么?那必须是:
    的头像 发表于 04-24 08:05 1002次阅读
    <b class='flag-5'>算</b>力系列基础篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>101:从零开始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    液冷是大模型对需求的必然选择?|英伟达 GTC 2024六大亮点

    在这个以高性能计算和大模型推动未来通用人工智能时代,已成为科技发展的隐形支柱。本文将重点探讨演进,深入分析在不同领域中
    的头像 发表于 04-10 12:57 719次阅读
    液冷是大模型对<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>需求</b>的必然选择?|英伟达 GTC 2024六大亮点

    简史,是一段波澜壮阔的历史

    今天这篇文章,我将给大家详细介绍一下人类演进过程。这是一段波澜壮阔的历史,值得我们驻足与回忆。Chrent人工时代人类对
    的头像 发表于 04-04 08:26 764次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>简史,是一段波澜壮阔的历史

    Sora爆火引全球需求激增?赛思时间同步技术使如虎添翼!

    近日,联想集团杨元庆表示,Sora的推出会加大全球AI需求,会进一步带动AI的普及和平民化应用。从供给侧来看,这一方面会提高对传统性能的要求,另一方面也需要进行新的技术创新。赛思时频创新技术使
    的头像 发表于 03-01 10:36 548次阅读
    Sora爆火引全球<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>需求</b>激增?赛思时间同步技术使<b class='flag-5'>算</b><b class='flag-5'>力</b>如虎添翼!

    数据语料库、算法框架和芯片在AI大模型中的作用和影响

    数据语料库、算法框架和芯片的确是影响AI大模型发展的三大重要因素。
    的头像 发表于 03-01 09:42 1355次阅读

    Sora需求引发业界对集结国内AI企业的探讨

    据周鸿祎观察,Sora视频分析所需恐远超千亿规模模型。因而,考虑到如今国内芯片供应受限,问题至关重要。事实上,Meta已有约50万台 GPU,明年预计追加至100万台;微软亦有
    的头像 发表于 02-25 10:03 659次阅读