0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种端到端的单阶段多视图融合3D检测方法MVAF-Net

新机器视觉 来源:新机器视觉 作者:新机器视觉 2021-01-27 11:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

该方法将激光雷达投影的BEV和前向视角、与摄像头视角图像作为检测输入,在特征融合中,提出attentive pointwise fusion (APF) 模块。设计attentive pointwise weighting (APW) 模块学习,附加另外两个任务foreground分类和中心回归。

af6eaade-6042-11eb-8b86-12bb97331649.png

如图是架构图:整个MVAF-Net包括三个部分

1)单视图特征提取(SVFE),

2)多视图特征融合(MVFF)

3)融合特征检测(FFD)。

afbae516-6042-11eb-8b86-12bb97331649.png

在SVFE部分,原始的RGB图像和点云由3-stream CNN主干(CV,BEV和RV)处理,生成多视图特征图,在BEV和RV做点云体素化。在MVFF部分,多视图特征与attentive pointwise fusion模块逐点自适应融合。融合的点特征通过attentive pointwise weighting模块进一步处理,对点特征进行加权并学习结构信息。在FFD部分,对融合和重加权的点特征再次体素化,并作融合主干输入给最终的3D检测。

RV投影表示为柱面坐标系统:

b02bd316-6042-11eb-8b86-12bb97331649.png

attentive pointwise fusion模块架构如下:

b0809f40-6042-11eb-8b86-12bb97331649.png

而attentive pointwise weighting模块架构如下:

b131afb0-6042-11eb-8b86-12bb97331649.png

MVAF-Net的主干网络细节如下图:

b1825e38-6042-11eb-8b86-12bb97331649.png

检测头包括:分类(focal loss)、框回归(SmoothL1 loss)和方向分类(softMax loss)。其总loss函数为

b20fc3a4-6042-11eb-8b86-12bb97331649.png

最后两个是前景分类项(focal loss)和中心回归项(SmoothL1 loss)。

结果如下:

b27a322a-6042-11eb-8b86-12bb97331649.png

结论

我们提出了一种端到端的单阶段多视图融合3D检测方法MVAF-Net,它由三部分组成:单视图特征提取(SVFE),多视图特征融合(MVFF)和融合特征检测(FFD)。在SVFE部分,三流CNN主干(CV,BEV和RV主干)使用LiDAR点云和RGB图像来生成多视图特征图。在MVFF部分,使用我们提出的注意点向融合(APF)模块实现了多视图特征的自适应融合,该模块可以使用注意力机制自适应地确定从多视图输入中引入了多少信息。此外,我们通过提出的注意点加权(APW)模块进一步改善了网络的性能,该模块可以对点特征进行加权并通过两个额外的任务来学习结构信息:前景分类和中心回归。大量实验验证了所提出的APF和APW模块的有效性。此外,所提出的MVAF-Net产生了竞争性结果,并且在所有单阶段融合方法中均达到了最佳性能。此外,我们的MVAF-Net胜过大多数两阶段融合方法,在KITTI基准上实现了速度和精度之间的最佳平衡。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模块
    +关注

    关注

    7

    文章

    2849

    浏览量

    53446
  • 摄像头
    +关注

    关注

    61

    文章

    5116

    浏览量

    103507
  • 激光雷达
    +关注

    关注

    982

    文章

    4553

    浏览量

    197113

原文标题:相机与激光雷达融合的3D目标检测方法MVAF-Net

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    行业首个基于地平线征程6M芯片的城市NOA方案正式交付上车

    2025年1月21日,理想AD Pro 4.0推送,行业首个基于地平线征程6M芯片的城市NOA方案正式交付上车。该方案由理想汽车主导研发,与轻舟智航共同打造,专为城市出行而生,
    的头像 发表于 01-24 11:03 589次阅读

    如何训练好自动驾驶模型?

    [首发于智驾最前沿微信公众号]最近有位小伙伴在后台留言提问:算法是怎样训练的?是模仿学习、强化学习和离线强化学习这三类吗?其实
    的头像 发表于 12-08 16:31 1610次阅读
    如何训练好自动驾驶<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>模型?

    Vitrox的v510i系列的3D AOI光学检测设备

    V510i部署在SMT生产线的 贴片机之后、回流焊炉之前或之后 ,主要用于检测贴装好的电子元件是否存在缺陷。其核心任务是: 3D与2D复合检测 :同时利用
    的头像 发表于 12-04 09:27 969次阅读

    Nullmax轨迹规划论文入选AAAI 2026

    11月8日,全球人工智能顶会 AAAI 2026 公布论文录用结果,Nullmax 研发团队的轨迹规划论文成功入选。该论文创新提出一种由粗
    的头像 发表于 11-12 10:53 1097次阅读

    板子的差分时钟如何正确地转化为

    本组使用的板子是GENESYS2,输入时钟信号为差分时钟信号,而E203使用的时钟都是的,所以需要将差分时钟信号转为。而通过网络检索,可以得到以下的
    发表于 10-27 07:29

    自动驾驶中“段式”和“二段式”有什么区别?

    [首发于智驾最前沿微信公众号]最近有小伙伴提问,段式和二段式
    的头像 发表于 10-24 09:03 1418次阅读
    自动驾驶中“<b class='flag-5'>一</b>段式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”和“二段式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”有什么区别?

    自动驾驶中常提的段式(段)是个啥?

    自动驾驶技术的发展,催生出技术的应用,段式
    的头像 发表于 10-18 10:16 1867次阅读

    文读懂特斯拉自动驾驶FSD从辅助的演进

    [首发于智驾最前沿微信公众号]自动驾驶行业发展至今,特斯拉直被很多企业对标,其FSD系统的每次更新,都会获得非常多人的关注。早期自动驾驶是个分层的、由模块组成的系统,感知、定位
    的头像 发表于 10-11 09:13 1135次阅读
    <b class='flag-5'>一</b>文读懂特斯拉自动驾驶FSD从辅助<b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的演进

    玩转 KiCad 3D模型的使用

    时间都在与 2D 的焊盘、走线和丝印打交道。但个完整的产品,终究是要走向物理世界的。元器件的高度、接插件的朝向、与外壳的配合,这些都是 2D 视图难以表达的。 幸运的是,KiCad
    的头像 发表于 09-16 19:21 1.2w次阅读
    玩转 KiCad <b class='flag-5'>3D</b>模型的使用

    黑芝麻智能全栈式辅助驾驶系统的应用场景

    黑芝麻智能推出的全新全栈辅助驾驶系统,以武当C1200系列高算力芯片为基石,深度融合自研感知算法,实现从场景感知
    的头像 发表于 09-09 17:19 2847次阅读

    自主工具链助力组合辅助驾驶算法验证

    彻底解决越来越多的长尾问题。图1辅助驾驶算法(图片来源网络)辅助驾驶算法是一种深度学习算法,该算法将传感器数据输入后,基于大模型直接输出车辆控制指令。
    的头像 发表于 08-26 17:41 3349次阅读
    自主工具链助力<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>组合辅助驾驶算法验证

    海伯森3D闪测传感器,工业检测领域的高精度利器

    随着信息技术的飞速进步,第四次视觉革命深度融合“人”“机”“物”,基于光学原理的3D视觉检测技术迎来爆发式发展,成为工业生产中更高效的检测利器。3D
    的头像 发表于 06-20 17:46 1607次阅读
    海伯森<b class='flag-5'>3D</b>闪测传感器,工业<b class='flag-5'>检测</b>领域的高精度利器

    ABSD-10169PSM差分有源巴伦Marki

    ABSD-10169PSM差分有源巴伦MarkiABSD-10169PSM是款使用3mm QFN表面贴装封装的GaAs有源MMIC平
    发表于 06-19 09:21

    为何成为各车企智驾布局的首要选择?

    算法实现输入输出的整体映射,技术通过将原始传感器数据直接输入单神经网络,并在网络中经
    的头像 发表于 06-07 11:52 855次阅读
    为何<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>成为各车企智驾布局的首要选择?

    文带你厘清自动驾驶架构差异

    [首发于智驾最前沿微信公众号]随着自动驾驶技术飞速发展,智能驾驶系统的设计思路也经历了从传统模块化架构大模型转变。传统模块化架构将感知、预测、规划和控制等子任务拆分开,分别由不
    的头像 发表于 05-08 09:07 1197次阅读
    <b class='flag-5'>一</b>文带你厘清自动驾驶<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>架构差异