0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种端到端的单阶段多视图融合3D检测方法MVAF-Net

新机器视觉 来源:新机器视觉 作者:新机器视觉 2021-01-27 11:24 次阅读

该方法将激光雷达投影的BEV和前向视角、与摄像头视角图像作为检测输入,在特征融合中,提出attentive pointwise fusion (APF) 模块。设计attentive pointwise weighting (APW) 模块学习,附加另外两个任务foreground分类和中心回归。

af6eaade-6042-11eb-8b86-12bb97331649.png

如图是架构图:整个MVAF-Net包括三个部分

1)单视图特征提取(SVFE),

2)多视图特征融合(MVFF)

3)融合特征检测(FFD)。

afbae516-6042-11eb-8b86-12bb97331649.png

在SVFE部分,原始的RGB图像和点云由3-stream CNN主干(CV,BEV和RV)处理,生成多视图特征图,在BEV和RV做点云体素化。在MVFF部分,多视图特征与attentive pointwise fusion模块逐点自适应融合。融合的点特征通过attentive pointwise weighting模块进一步处理,对点特征进行加权并学习结构信息。在FFD部分,对融合和重加权的点特征再次体素化,并作融合主干输入给最终的3D检测。

RV投影表示为柱面坐标系统:

b02bd316-6042-11eb-8b86-12bb97331649.png

attentive pointwise fusion模块架构如下:

b0809f40-6042-11eb-8b86-12bb97331649.png

而attentive pointwise weighting模块架构如下:

b131afb0-6042-11eb-8b86-12bb97331649.png

MVAF-Net的主干网络细节如下图:

b1825e38-6042-11eb-8b86-12bb97331649.png

检测头包括:分类(focal loss)、框回归(SmoothL1 loss)和方向分类(softMax loss)。其总loss函数为

b20fc3a4-6042-11eb-8b86-12bb97331649.png

最后两个是前景分类项(focal loss)和中心回归项(SmoothL1 loss)。

结果如下:

b27a322a-6042-11eb-8b86-12bb97331649.png

结论

我们提出了一种端到端的单阶段多视图融合3D检测方法MVAF-Net,它由三部分组成:单视图特征提取(SVFE),多视图特征融合(MVFF)和融合特征检测(FFD)。在SVFE部分,三流CNN主干(CV,BEV和RV主干)使用LiDAR点云和RGB图像来生成多视图特征图。在MVFF部分,使用我们提出的注意点向融合(APF)模块实现了多视图特征的自适应融合,该模块可以使用注意力机制自适应地确定从多视图输入中引入了多少信息。此外,我们通过提出的注意点加权(APW)模块进一步改善了网络的性能,该模块可以对点特征进行加权并通过两个额外的任务来学习结构信息:前景分类和中心回归。大量实验验证了所提出的APF和APW模块的有效性。此外,所提出的MVAF-Net产生了竞争性结果,并且在所有单阶段融合方法中均达到了最佳性能。此外,我们的MVAF-Net胜过大多数两阶段融合方法,在KITTI基准上实现了速度和精度之间的最佳平衡。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模块
    +关注

    关注

    7

    文章

    2740

    浏览量

    47831
  • 摄像头
    +关注

    关注

    60

    文章

    4872

    浏览量

    96495
  • 激光雷达
    +关注

    关注

    969

    文章

    4041

    浏览量

    190546

原文标题:相机与激光雷达融合的3D目标检测方法MVAF-Net

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    SciChart 3D for WPF图表库

    DirectX 支持的 WPF 3D 图表和广泛的 API 完成工作。 WPF 3D 图表性能 我们传奇的 WPF 3D 图表性能由广泛的
    的头像 发表于 01-23 13:49 150次阅读
    SciChart <b class='flag-5'>3D</b> for WPF图表库

    sc单模纤耦合器、有接收和发射区分吗?

    的详细解释: 、SC单模纤耦合器 定义:SC单模纤耦合器是一种用于分配或合并光信号的光学器件,它能够将来自个光纤的光信号分配到多个光
    的头像 发表于 11-01 10:03 355次阅读

    TPA3129D2支持输入吗?输入情况,N要怎么接?

    问题1:TPA3129D2支持输入吗?输入情况,N要怎么接?跨电容接地吗?想
    发表于 10-14 06:09

    放大器输出的区别

    放大器是电子学中的一种重要设备,用于增强信号的幅度。在放大器的设计和应用中,输出和双输出是两常见的输出方式。这两
    的头像 发表于 10-08 16:36 2061次阅读

    功放和双的区别是什么

    功放和双功放是两不同的音频放大器设计,它们在结构、性能和应用方面都有各自的特点。以下是对这两功放的比较: 1. 定义与基本原理
    的头像 发表于 10-08 16:35 1683次阅读

    测试用例怎么写

    编写测试用例是确保软件系统从头到尾能够正常工作的关键步骤。以下是个详细的指南,介绍如何编写
    的头像 发表于 09-20 10:29 599次阅读

    放大电路的特点是什么

    放大电路是一种电子放大器,它在音频和射频领域中非常常见。这种电路的特点是只有个输入
    的头像 发表于 09-03 10:19 563次阅读

    差分转电路作用是什么

    、成本低等优点。因此,差分转电路在实际应用中具有重要的意义。 本文将从以下几个方面介绍差分转电路的作用、原理、设计方法和应用场景:
    的头像 发表于 08-05 09:26 2203次阅读

    差分转电路中,同相与反相负载相同吗?

    差分转电路是一种常见的信号转换电路,它将差分信号转换为信号,以适应不同的应用场景。在差分转
    的头像 发表于 08-05 09:22 1115次阅读

    输入和双输入的区别是什么

    输入和双输入是电子电路设计中的两不同的输入方式。它们在电路设计、性能和应用方面存在些关键的区别
    的头像 发表于 07-31 10:50 3103次阅读

    差分放大电路输入和双输入的区别

    差分放大电路是一种常见的模拟电路,广泛应用于信号放大、滤波、比较等场合。差分放大电路根据输入方式的不同,可以分为输入和双输入两形式。
    的头像 发表于 07-08 14:54 3541次阅读

    苏州吴中区色PCB板元器件3D视觉检测技术

    3D视觉检测相较于2D视觉检测,有其独特的优势,不受产品表面对比度影响,精确检出产品形状,可以测出高度(厚度)、体积、平整度等。在实际应用中可以与2
    的头像 发表于 06-14 15:02 480次阅读
    苏州吴中区<b class='flag-5'>多</b>色PCB板元器件<b class='flag-5'>3D</b>视觉<b class='flag-5'>检测</b>技术

    探头的最大浮动电压是多少?

    在电子测试和测量领域,探头是一种常用的工具,用于测量电路中的电压信号。然而,探头在实际应用中需要考虑的
    的头像 发表于 03-29 14:15 739次阅读
    <b class='flag-5'>单</b><b class='flag-5'>端</b>探头的最大浮动电压是多少?

    采用的逆设计方法实现多维度通道超构表面全息设计

    近日,北京理工大学光电学院黄玲玲教授团队采用的逆设计方法实现了多维度通道超构表面全息设计。
    的头像 发表于 03-11 11:35 1344次阅读
    采用<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的逆设计<b class='flag-5'>方法</b>实现多维度<b class='flag-5'>多</b>通道超构表面全息设计

    移动协作机器人的RGB-D感知的处理方案

    本文提出了一种用于具有双目视觉的自主机器人的三维语义场景感知的流程。该流程包括实例分割、特征匹配和点集配准。首先,利用RGB图像进行
    发表于 02-21 15:55 781次阅读
    移动协作机器人的RGB-<b class='flag-5'>D</b>感知的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>处理方案