0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ADS2.0算法演进与对算力的新需求

佐思汽车研究 来源:佐思汽车研究 作者:Dr. Luo 2022-06-14 11:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

爱因斯坦有曰,“瀚宇初开,万物当生也。万物可谓振动,能光旋律之荡漾焉。”(注:作者中译)。AI新技术革命时代,大算力芯片也拨响了自动驾驶ADS的琴弦。大珠小珠般的AI算法在大算力驱动下应运而振,应时而动,解决了ADS从L2到L5逐级演进中的众多技术难题。ADS每增加一级,算力需求也会呈现十倍速上升,L4级别可预计的算力需求在1000TOPS,L5级别估计在2000-10000TOPS。如图1所示,后摩尔时代工艺更新性能提升放缓,延续性创新的边际效益递减,新兴的大算力架构在不断涌现,加上驾驶AI算法高速迭代演进,在未来5-10年内可能会为后来的技术追赶者提供非常奇妙的一个直线超车的机会窗口。

8f14599e-eb8f-11ec-ba43-dac502259ad0.png

图1. 大算力时代自动驾驶ADS领域的机遇与挑战

当前ADS自动驾驶采用决策层后融合的方式,其局限性主要表现在在极端恶劣气候与复杂遮挡等不确定性场景下分别进行单模结构化信息提取后再进行融合决策,每个通道信息会有不同层面丢失,很难能够进行多模有效互补与特征提取共享,算力内卷且性能远低于预期。 未来ADS算法会进入一个全新的2.0阶段,4D空间下基于时空的多模感知与融合推理, 也就是特征提取/统计推断/应急预测相结合,实现在动态复杂的有噪声干扰等场景下,全程安全无碰撞的高效行驶。挑战可以体现在,动态随机的人车物交互,多变天气路况,以及突发交通事件等。

ADS算法2.0从决策层后融合走向特征级前融合,当前行业ADS2.0算法主要演进方向为:

多模感知:主要是针对Camera/LiDAR/Radar海量数据流进行特征提取,DL网络主流趋势是卷积CNN或者贝叶斯NN+Transformer的组合架构,在统一的特征空间实现多模感知,特征融合共享以及多任务来提升算力的整体效率。

融合推理:主要是基于模型与基于数据的双学习模式,DL网络主流趋势是基于目标交互GNN或基于统计模型的贝叶斯RL强化学习或On-Policy应急学习,实现ADS安全可信的预测规划与控制。

ADS2.0算法演进与对算力的新需求,可以总结为:

演进趋势1:感知定位预测决策控制模块化处理流程中, 从决策层后融合走向感知层前融合,算法能够在统一空间支持多模融合,多任务共享;

演进趋势2:预测与规划联合建模,从可获得的Off-policy数据进行学习,能够自学习处理不确定性下的安全性问题,解决可解释问题,持续学习解决新场景问题;

算力新需求:从compute-bound(矩阵-矩阵乘)走向memory-bound(矩阵-矢量乘),从偏计算走向偏存取。

当前市场上主流算力NPU芯片,都存在几个共性问题,一是算法效率低,多数只针对CNN(例如3x3卷积)优化;二是内存墙问题:处理单元PE存算分离,数据共享难;三是能耗墙问题:数据重复搬移,耗能增加>30-70%。所以,当前针对某些特定算法的芯片,无法解决未来ADS 2.0的需求。

从工程实践上看,ADS 2.0算法需通过“硬件预埋,算法迭代,算力均衡”,提供一个向前兼容的解决方案,以通用大算力(CPU的5-10倍性能提升,NPU的100-500倍性能提升)来解决未来不确定性的算法演进:

底层架构的演进:从存算分离过渡到近内存计算,最终走向内存计算;

数据通道与模型:高速数据接口;数据压缩+模型压缩+低精度逼近计算+稀疏计算加速;

并行的顶层架构:模型-硬件联合设计,以及硬设计可配置+硬件调度+软运行可编程调度引擎。

未来,自动驾驶算法不会止步于ADS 2.0,而能够真正支持人类自动驾驶梦想的算法ADS 3.0趋势,我们估计会采用一个DNN网络来进行端到端学习。设想一下,有足够的专家驾驶数据用来做模仿学习或采用RL自学习模式,可以有效降低数据标注的信息瓶颈与严重依赖,从而能够从多模多样化数据层面进行非直接的推理或者博弈类的对抗学习。ADS 3.0目前来看模型的可信与可解释程度依然远低于预期。ADS系统的总体演进趋势,可以总结为:

场景演进:负载多样性

➤从数量有限的摄像头设置走向 Camera + LiDAR + Radar 多模态组合。

趋势演进:算法多样性

➤从CNN+Rule-based方案走向CNN, RNN,Transformer, GNN, Bayesian, Deep ReinforcementLearning, Dynamic DNN, NAS Generated DNN, Variably Quantized DNN多算法组合。

大算力时代,ADS系统首先是模仿人类的驾驶行为,通过注意力机制,期望在感知定位预测规划控制领域提供远超人类的决策能力。这需要我们在AI的三要素(算法、算力、数据)基础上添加第四要素,知识或者常识。

8f88890e-eb8f-11ec-ba43-dac502259ad0.png

而上述要素,均需要在充分理解算法的快速迭代的大趋势下,拥有充足的超大通用算力,ADS系统在离线模仿学习人类驾驶先验知识经验与规则的基础上,能够提供在线自主学习能力,通过自学习激励与博弈共赢策略应对众多不确定性的人机交互的复杂环境,能够对决策不充分的场景下做到安全应对和提供可信解释能力。此外,大算力芯片也需要能够通过额外的算力,对芯片内百万级的并行计算单元提供故障检测与安全规避能力,对大量多模传感器的部分或者完全失效进行有效检测与应对决策处理,对驾驶环境针对传感器的主动攻击与外界目标非主动干扰进行有效检测与实时决策处理。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4803

    浏览量

    98530
  • ADS1220
    +关注

    关注

    24

    文章

    488

    浏览量

    126419
  • 自动驾驶
    +关注

    关注

    794

    文章

    14985

    浏览量

    181462

原文标题:自动驾驶行业快速迭代演变的算法和算力浅论

文章出处:【微信号:zuosiqiche,微信公众号:佐思汽车研究】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    成都汇阳投资关于AI 引爆需求,存储芯片涨价周期来袭

    AI 黑洞来袭 ,存储需求呈爆炸式增长 AI基础设施的爆发成为存储芯片需求的核心驱动力,
    的头像 发表于 03-27 17:12 417次阅读

    天数智芯助力DeepLink异构训推一体化升级

    当前,通用人工智能发展驶入快车道,大模型对需求呈现爆发式增长,异构的高效协同成为释放
    的头像 发表于 03-26 09:30 440次阅读
    天数智芯助力DeepLink异构<b class='flag-5'>算</b><b class='flag-5'>力</b>训推一体化升级

    海瑞思全流程密封检测方案为基础设施筑牢安全防线

    随着以英伟达新一代高功耗平台为代表的技术持续推进,叠加云计算厂商对高密度部署的需求增长,单机柜功率密度不断提升,传统风冷在高功率密度
    的头像 发表于 02-10 16:11 742次阅读

    将AI送上太空,是终极方案还是疯狂幻想?评论区说出你的阵营!

    AI
    江苏易安联
    发布于 :2026年01月06日 09:43:34

    从云端集中到边缘分布:边缘智如何重塑网络布局

    临结构性矛盾,传统数据中心模式难以完全满足实时需求——边缘智正在成为解决这一矛盾的关键力量。1、边缘智:重新定义
    的头像 发表于 12-25 11:34 600次阅读
    从云端集中到边缘分布:边缘智<b class='flag-5'>算</b>如何重塑<b class='flag-5'>算</b><b class='flag-5'>力</b>网络布局

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    捷智重大更新|API接口全面开放,调用更高效

    人工调度太耗时?业务系统对接总卡壳?捷智重磅升级——租赁平台API接口正式开放,让
    的头像 发表于 11-21 18:41 1080次阅读
    捷智<b class='flag-5'>算</b>重大更新|API接口全面开放,<b class='flag-5'>算</b><b class='flag-5'>力</b>调用更高效

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    反而压到了310W。更有意思的是它的异构架构:NPU+CPU+DVPP的组合,居然能同时扛住训练和推理场景,之前做自动驾驶算法时,用它跑模型时延直接降了20%。 但疑惑也有:这种密度下,散热怎么解决?而且昇腾的生态适配速度能
    发表于 10-27 13:12

    需求狂飙下的“效率竞赛”,国产AI芯片有何破局之道?

    %,同比上升12.8个百分点。 10月15日,在2025湾芯展上,云天励飞副总裁罗忆给现场听众带来《打造智时代的新质生产》演讲,他现场提出的两大观点引发大家的共鸣。他表示,目前国内AI产业面临两大拐点:一是
    的头像 发表于 10-19 01:11 1w次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>需求</b>狂飙下的“效率竞赛”,国产AI芯片有何破局之道?

    IP广域网助力互联网建设进入快车道

    人工智能大模型等应用爆发式发展带动了智能需求激增,全国各地纷纷建设大量智中心。在迎来新机遇的同时,力行业也面临数据安全、提高企业用
    的头像 发表于 09-25 10:40 862次阅读

    与电力的终极博弈,填上了AIDC的“电力黑洞”

    ),专注于提供人工智能训练与推理所需的服务、数据服务和算法服务。AIDC采用异构计算架构,结合GPU、FPGA、ASIC等多种AI加速芯片,形成高并发分布式系统,以满足大模型训练和推理的极高
    的头像 发表于 09-22 02:43 8998次阅读

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾视科技的AI
    的头像 发表于 09-19 15:26 2067次阅读
    什么是AI<b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾视科技的AI
    的头像 发表于 09-19 15:25 1028次阅读
    什么是AI<b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    不够、交付太慢?捷智裸金属租赁对标物理机性能,让你立马用上高

    2025年国产大模型升级带动租赁需求爆发,高性能服务器“一机难求”。中研普华预测,今年我国
    的头像 发表于 09-12 20:06 1500次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>不够、交付太慢?捷智<b class='flag-5'>算</b>裸金属租赁对标物理机性能,让你立马用上高<b class='flag-5'>算</b><b class='flag-5'>力</b>!

    一文看懂AI集群

    最近这几年,AI浪潮席卷全球,成为整个社会的关注焦点。大家在讨论AI的时候,经常会提到AI集群。AI的三要素,是算法和数据。而AI
    的头像 发表于 07-23 12:18 1923次阅读
    一文看懂AI<b class='flag-5'>算</b><b class='flag-5'>力</b>集群