0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

轻量级占用网络FlashOcc:主打实时性,高精度高效内存

后摩智能 来源:后摩智能 2024-01-16 11:37 次阅读

特斯拉在2021 AI Day上提出BEV障碍物感知的思路后,BEV逐渐成为业界争相落地的热点。

但BEV也存在一些待解决问题,比如:

(1) 仅能对真实世界中类别限定的目标进行的感知(如图1.b所示),如果想得到可行驶区域、环岛、人行横道、上方障碍物(如各类红绿灯或摄像头悬臂、地库限高架等)、临时广告牌等,需要额外的感知模块去进行处理;

(2) 障碍物仅能用3D框描述,具体的形状轮廓也丢失了;

(3) 如果行驶环境中出现没见过的物体(如图1.a中右下角的红色移动广告牌或者红绿灯悬臂),那障碍物检测也会失效,只能通过多模态开放场景检测技术来弥补这类问题,但是这在目前算力有限的自动驾驶芯片上是无法实现的。

因此在2022的AI day上特斯拉提出占据预测的新思路,成功解决了上述问题。占据预测任务就是将以自车为中心的三维空间划分成一个个小的体素栅格,然后预测每个栅格的语义类别。具体效果如图1.c所示,可以看出占据预测可以对整个复杂世界的所有物体进行有效感知,从而有效的解决上述障碍物预测的问题。

但是现有公开的占据预测方法都需要构建三维体素级的特征表示,这不可避免地引入大量计算资源消耗,此外还需要硬件平台对3D(可变形)卷积或者transformer模块有较好的支持,这些都阻碍了业界将占用预测在实车上的部署落地。

553a0bb4-b420-11ee-8b88-92fbcf53809c.png

图 1. 障碍物检测与占据预测效果对比。受训练数据约束,预测范围为前后左右40m,上下-1m到5.4m,栅格粒度0.4m。

与使模型变得更大、更复杂从而取得优异性能的趋势相反,理想的框架应该对不同的端上芯片部署友好,并且保持高精度。本着轻量易部署且性能无损甚至还提升的初衷下,大连理工、后摩智能以及阿德莱德联合提出了一种简单轻量的占据插件,称之为FlashOCC。

通过在主流占据方法(BEVDetOcc、FBOcc、UniOcc等)上的验证,证明了FlashOCC在部署显存需求、推理时间、训练耗时以及模型精度上都取得了最优的权衡,并且对各类端上芯片部署友好。

554cdece-b420-11ee-8b88-92fbcf53809c.png

论文地址:https://arxiv.org/abs/2311.12058

代码链接:https://github.com/Yzichen/FlashOCC

内容简介

方法架构:

555f2d7c-b420-11ee-8b88-92fbcf53809c.png

图 2插件概述以及综合性能比对

FlashOcc以极优的精度完成了实时环视3D占用预测,代表了该领域的开创性贡献。此外,它还展示了跨不同车载平台部署的优越性,因为不需要昂贵的体素级特征处理,从而避免了transformer或 3D(可变形)卷积算子。FlashOcc通过2类替换对现有基于体素级3D特征的占据任务进行提升:

(1) 用2D卷积替换3D卷积;

(2) 用通道到高度变换替换从3D卷积得到的占用预测,具体如图1.(a)所示。图1.(b)则通过图表详细说明了模型精度与速度、推理内存消耗以及训练时间等因素之间的权衡。

虽然FlashOcc专注于以即插即用的方式增强现有模型,但它仍然可以分为五个基本模块,具体如图2所示:

(1) 用于提取图像特征的2D图像编码器

(2) 将2D图像特征映射到BEV表征的视图转换模块。

(3) 修正BEV特征的BEV编码器。

(4) 预测每个体素分割标签的占用预测头。

(5) 集成历史信息以提高性能的时间融合模块(可选)。

5573f3ce-b420-11ee-8b88-92fbcf53809c.png

图 3框架图

实验表明我们方法在同比条件下都取得了最优的性能以及训练及部署资源消耗。

5588290c-b420-11ee-8b88-92fbcf53809c.png

表 1Occ3D-nuSences验证集上的性能

5597283a-b420-11ee-8b88-92fbcf53809c.png

表 2训练及部署消耗说明

下图对模型预测进行可视化。由于用于训练的数据的栅格细粒度是40cmx40cmx40cm,因此对细节的构建较为粗糙。但即便如此,可以看到我们的方法可以有效预测横跨马路悬空的红绿灯,这证明FlashOcc有效的构建了高度信息,此外悬空树木的轮廓预测也证明了这一点;而图中表示行人的占据栅格,在胸口前栅格占据表示手持手机、腿后栅格占据表示后拉行李箱,证明我们方法对细节外形捕捉能力;交通锥的准确预测证明了小目标捕获能力。

55a6bcd2-b420-11ee-8b88-92fbcf53809c.png

图 4 可视化。受训练数据约束,预测范围为前后左右40m,上下-1m到5.4m,栅格粒度0.4m。

总结与展望

FlashOcc初步探索了性能无损端上部署友好轻量级占用预测方法,为占据任务实车落地提供技术原型支撑,精度、效率和内存消耗均超越当前SOTA。未来进一步探索高效的端上可部署的端到端自动驾驶方案将是我们重要的研究方向。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FlaSh
    +关注

    关注

    10

    文章

    1633

    浏览量

    147959
  • 特斯拉
    +关注

    关注

    66

    文章

    6311

    浏览量

    126552
  • 自动驾驶芯片

    关注

    3

    文章

    47

    浏览量

    5088

原文标题:后摩前沿 | 轻量级占用网络FlashOcc:主打实时性,高精度高效内存

文章出处:【微信号:后摩智能,微信公众号:后摩智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    音频信号采集为什么要用专用的CODEC来实现,普通高精度高采样率ADC可以吗?

    1、音频信号采集为什么要用专用的CODEC来实现,普通高精度高采样率ADC可以吗? 2、音频信号为什么要过采样。只是为了提高采样精度吗?如果只是为了提高采样精度,为什么不用高精度的A
    发表于 10-21 07:56

    VS高精度电压传感器

            VS系列电压传感器是一种量程覆盖35kV及以下的直流、交流、周期脉冲以及各种不规则波形的电压传感器,精度高达0.05%FS、带宽高达100kHz,可满足宽频带、高精度电压测试需求
    的头像 发表于 09-19 15:55 352次阅读
    VS<b class='flag-5'>高精度</b>电压传感器

    TMAG5123平面高精度高压霍尔效应开关数据表

    电子发烧友网站提供《TMAG5123平面高精度高压霍尔效应开关数据表.pdf》资料免费下载
    发表于 08-12 10:47 0次下载
    TMAG5123平面<b class='flag-5'>高精度高</b>压霍尔效应开关数据表

    TMAG5123-Q1 汽车类平面高精度高压霍尔效应开关数据表

    电子发烧友网站提供《TMAG5123-Q1 汽车类平面高精度高压霍尔效应开关数据表.pdf》资料免费下载
    发表于 08-12 09:56 0次下载
    TMAG5123-Q1 汽车类平面<b class='flag-5'>高精度高</b>压霍尔效应开关数据表

    国产芯上运行TinyMaxi轻量级的神经网络推理库-米尔基于芯驰D9国产商显板

    本篇测评由优秀测评者“短笛君”提供。本文将介绍基于米尔电子MYD-YD9360商显板(米尔基于芯驰D9360国产开发板)的TinyMaxi轻量级的神经网络推理库方案测试。 算力测试TinyMaix
    发表于 08-09 18:26

    实时Linux:解锁高效能和可靠的关键

    实时Linux结合容器技术,提供了高度灵活和可扩展的解决方案,特别适合于需要快速响应和高可靠的应用场景。实时Linux能够保证关键任务及时执行,而容器技术则为应用提供了轻量级、隔离的
    的头像 发表于 08-08 11:21 277次阅读
    <b class='flag-5'>实时</b>Linux:解锁<b class='flag-5'>高效</b>能和可靠<b class='flag-5'>性</b>的关键

    国产芯上运行TinyMaxi轻量级的神经网络推理库-米尔基于芯驰D9国产商显板

    D9360国产开发板)的TinyMaxi轻量级的神经网络推理库方案测试。 算力测试 TinyMaix 是面向单片机的超轻量级的神经网络推理库,即 TinyML 推理库,可以让你在任意
    发表于 08-07 18:06

    鸿蒙语言基础类库:ohos.data.storage 轻量级存储

    轻量级存储为应用提供key-value键值型的文件数据处理能力,支持应用对数据进行轻量级存储及查询。数据存储形式为键值对,键的类型为字符串型,值的存储数据类型包括数字型、字符型、布尔型。
    的头像 发表于 07-15 18:21 973次阅读

    国产芯上运行TinyMaxi轻量级的神经网络推理库-米尔基于芯驰D9国产商显板

    本篇测评由与非网的优秀测评者“短笛君”提供。本文将介绍基于米尔电子MYD-YD9360商显板(米尔基于芯驰D9360国产开发板)的TinyMaxi轻量级的神经网络推理库方案测试。算力测试
    的头像 发表于 07-05 08:02 1871次阅读
    国产芯上运行TinyMaxi<b class='flag-5'>轻量级</b>的神经<b class='flag-5'>网络</b>推理库-米尔基于芯驰D9国产商显板

    什么是高精度定位平板?

    普通GPS设备的精度高精度定位平板的关键技术是RTK(Real-Time Kinematic,实时动态测量)技术。RTK技术通过接收来自基站的差分信号,实时修正GPS信号中的误差,
    的头像 发表于 06-12 17:53 812次阅读

    OPA627-DIE高精度高速DIFET运算放大器数据表

    电子发烧友网站提供《OPA627-DIE高精度高速DIFET运算放大器数据表.pdf》资料免费下载
    发表于 06-12 11:11 2次下载
    OPA627-DIE<b class='flag-5'>高精度高</b>速DIFET运算放大器数据表

    芯片行业对高精度高低温试验箱的需求日益凸显

    芯片行业对高精度高低温试验箱的需求日益凸显
    的头像 发表于 05-13 21:16 741次阅读
    芯片行业对<b class='flag-5'>高精度高</b>低温试验箱的需求日益凸显

    未来轻量级深度学习技术探索

    除了轻量级架构设计外,作者提到了可以应用于压缩给定架构的各种高效算法。例如,量化方法 旨在减少数据所需的存储空间,通常是通过用8位或16位数字代替32位浮点数,甚至使用二进制值表示数据。
    发表于 04-23 15:54 389次阅读
    未来<b class='flag-5'>轻量级</b>深度学习技术探索

    EtherCAT站控制器系统实时测试

    EtherCAT作为高效的现场总线网络技术,其实时性能需依赖高实时操作系统才能充分展现。本文以ZMC600E为例,测试系统实时
    的头像 发表于 03-26 08:23 753次阅读
    EtherCAT<b class='flag-5'>主</b>站控制器系统<b class='flag-5'>实时</b><b class='flag-5'>性</b>测试

    百度智能云推出全新轻量级大模型

    在近日举办的百度智能云千帆产品发布会上,三款全新的轻量级大模型——ERNIE Speed、ERNIE Lite以及ERNIE Tiny,引起了业界的广泛关注。相较于传统的千亿级别参数大模型,这些轻量级大模型在参数量上有了显著减少,为客户提供了更加灵活和经济
    的头像 发表于 03-22 10:28 661次阅读