0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大疆、港科大联手!双目3D目标检测实验效果大放送

电子工程师 来源:lp 2019-03-12 09:43 次阅读

CVPR 2019的文章出来了,今天聊聊双目的 3D object detection。这是一篇来自 DJI (大疆)与港科大合作的文章《Stereo R-CNN based 3D Object Detection for Autonomous Driving》,作者分别是 Peiliang Li,陈晓智(DJI,MV3D的作者)和港科大的 Shaojie Shen 老师。

论文链接,文中称代码将开源

https://arxiv.org/abs/1902.09738

1. Introduction

2018 年在 3D 检测方面的文章层出不穷,也是各个公司无人驾驶或者机器人学部门关注的重点,包含了点云,点云图像融合,以及单目 3D 检测,但是在双目视觉方面的贡献还是比较少,自从 3DOP 之后。

总体来说,图像的检测距离、图像的 density 以及 context 信息,在 3D检测中是不可或缺的一部分,因此作者在这篇文章中挖掘了双目视觉做 3D检测的的潜力。

2.Network Structure

整个网络结构分为以下的几个部分。

1). RPN部分,作者将左右目的图像通过stereoRPN产生相应的proposal。具体来说stereo RPN是在FPN的基础上,将每个FPN的scale上的feature map的进行concat的结构。

2). Stereo Regression,在RPN之后,通过RoiAlign的操作,得到each FPN scale下的left and right Roi features,然后concat相应的特征,经过fc层得到object class, stereo bounding boxes dimension还有viewpoint angle(下图所示) 的值。这里解释一下viewpoint,根据Figure3.,假定物

3). keypoint的检测。这里采用的是类似于mask rcnn的结构进行关键点的预测。文章定义了4个3D semantic keypoint,即车辆底部的3D corner point,同时将这4个点投影到图像,得到4个perspective keypoint,这4个点在3D bbox regression起到一定的作用,我们在下一部分再介绍。

在keypoint检测任务中,作者利用RoiAlign得到的14*14feature map,经过conv,deconv最后得到6 * 28 * 28的feature map,注意到只有keypoint的u坐标会提供2D Box以外的信息,因此,处于减少计算量的目的,作者aggregate每一列的feature,得到6 * 28的output,其中,前4个channel代表4个keypoint被投影到相应的u坐标的概率,后面两个channel代表是left or right boundary上的keypoint的概率。

3. 3D Box Estimation

通过网络回归得到的 2D box 的 dimension,viewpoint,还有 keypoint,我们可以通过一定的方式得到3D box的位置。定义 3D box 的状态x = [x, y, z, θ]。

Figure 5,给出了一些稀疏的约束。包含了特征点的映射过程。这里也体现了keypoint的用处。

上述公式即为约束方程,因此可以通过高斯牛顿的方法直接求解。具体可以参考论文的引文17。这里我们简单证明一下第一个公式。注意,这里的假设都是u,v坐标都已经经过相机内参的归一化了。

4. Dense 3D Box Alignment

这里就回到shenshaojie老师比较熟悉的BA的过程了,由于part 3仅仅只是一个object level的深度,这里文章利用最小化左右视图的RGB的值,得到一个更加refine的过程。定义如下的误差函数

求解可以利用G20或者ceres也可以完成。整个alignment过程其实相对于深度的直接预测是更加robust的,因为这种预测方法,避免了全局的depth estimation中的一些invalid的pixel引起的ill problem的问题。

5. experiment

作者在实验这块达到了双目视觉的state-of-the-art,同时对于各个module也做了很充足的实验(这块请查看原论文)。

下面是图a、b、c为处理结果示例,每幅图像内部上中下三部分,分别为左眼图像检测结果、右眼图像检测结果、鸟瞰视图检测结果。

图a

图b

图c

6. Insight

最后谈谈文章给我的一些 insights,首先,整个文章将传统的 detection 的任务,结合了 geometry constraint 优化的方式,做到了3D位置的估计,想法其实在不少文章sfm-learner之类的文章已经有体现过了,不过用在3Ddetection上面还是比较新颖,避免了做双目匹配估计深度的过程。也属于slam跟深度学习结合的一篇文章,感兴趣的朋友可以继续看看(下面链接)相关文章

arxiv.org/abs/1802.0552

谈几点我个人意义上的不足吧,首先耗时过程 0.28s 的 inference time,不过可能作者的重点也不在这个方面,特征的利用上可以更加有效率,在实现上。其次,能不能采用deep3dbox的方式预测dimension,然后添加入优化项呢...总体来说,是一篇不错的值得一读的文章!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    28212

    浏览量

    206565
  • 3D
    3D
    +关注

    关注

    9

    文章

    2863

    浏览量

    107331
  • 图像检测
    +关注

    关注

    0

    文章

    33

    浏览量

    11866

原文标题:大疆、港科大联手!双目3D目标检测实验效果大放送 | CVPR 2019

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    透明塑料件喷粉3D扫描CAV全尺寸检测逆向3D建模设计服务-CASAIM

    3D建模
    中科院广州电子
    发布于 :2024年08月30日 10:04:53

    安宝特产品 安宝特3D Analyzer:智能的3D CAD高级分析工具

    安宝特3D Analyzer包含多种实用的3D CAD高级分析工具,包括自动比对模型、碰撞检测、间隙检查、壁厚检查,以及拔模和底切分析,能够有效提升3D CAD模型
    的头像 发表于 08-07 10:13 335次阅读
    安宝特产品  安宝特<b class='flag-5'>3D</b> Analyzer:智能的<b class='flag-5'>3D</b> CAD高级分析工具

    可存储500张人脸的双目3D人脸识别模块

    。HLK-FM888是一款红外+可见光双目人脸识别算法模组,内嵌双目3D活体检测算法和基于大数据训练的深度神经网络动态可见光识别算法,搭载高像素的摄像头,在增强对环境光线的适应性和
    的头像 发表于 07-28 08:39 732次阅读
    可存储500张人脸的<b class='flag-5'>双目</b><b class='flag-5'>3D</b>人脸识别模块

    广东3D扫描钣金件外观尺寸测量3D偏差检测对比解决方案CASAIM

    3D扫描
    中科院广州电子
    发布于 :2024年07月22日 16:13:45

    裸眼3D笔记本电脑——先进的光场裸眼3D技术

    效果的用户,这款笔记本电脑都能满足你的需求。 一、卓越的3D模型设计能力 英伦科技裸眼3D笔记本电脑采用最新的光场裸眼3D技术,使用户无需佩戴3D
    的头像 发表于 07-16 10:04 461次阅读

    浪潮云洲发布云洲烛龙双目结构光3D相机

    在科技日新月异的今天,智能制造正逐步成为推动社会发展的重要力量。近日,备受瞩目的2024世界智能产业博览会在天津盛大开幕。本次博览会不仅汇聚了全球智能产业的精英,更见证了一项创新技术的诞生——浪潮云洲旗下国器智眸公司研发的“云洲烛龙双目结构光3D相机”正式发布。
    的头像 发表于 06-25 18:00 1122次阅读

    苏州吴中区多色PCB板元器件3D视觉检测技术

    3D视觉检测相较于2D视觉检测,有其独特的优势,不受产品表面对比度影响,精确检出产品形状,可以测出高度(厚度)、体积、平整度等。在实际应用中可以与2
    的头像 发表于 06-14 15:02 369次阅读
    苏州吴中区多色PCB板元器件<b class='flag-5'>3D</b>视觉<b class='flag-5'>检测</b>技术

    工业镜头在3D结构光检测中实际应用

    工业镜头在3D结构光检测中实际应用
    的头像 发表于 06-01 08:34 278次阅读
    工业镜头在<b class='flag-5'>3D</b>结构光<b class='flag-5'>检测</b>中实际应用

    重磅| 奥比中光全新双目系列3D相机,搭载自研芯片,为智能机器人而生

      4月29日,奥比中光正式发布全新Gemini 330系列双目3D相机,首发产品包括Gemini 335、Gemini 335L两款通用型高性能双目3D相机。新品首次搭载奥比中光为机
    发表于 04-30 18:00 424次阅读
    重磅| 奥比中光全新<b class='flag-5'>双目</b>系列<b class='flag-5'>3D</b>相机,搭载自研芯片,为智能机器人而生

    奥比中光正式发布全新Gemini 330系列双目3D相机

    4月29日,奥比中光正式发布全新Gemini 330系列双目3D相机,首发产品包括Gemini 335、Gemini 335L两款通用型高性能双目3D相机。
    的头像 发表于 04-30 10:41 588次阅读
    奥比中光正式发布全新Gemini 330系列<b class='flag-5'>双目</b><b class='flag-5'>3D</b>相机

    Nullmax提出多相机3D目标检测新方法QAF2D

    今天上午,计算机视觉领域顶会CVPR公布了最终的论文接收结果,Nullmax感知部门的3D目标检测研究《Enhancing 3D Object Detection with 2
    的头像 发表于 02-27 16:38 1084次阅读
    Nullmax提出多相机<b class='flag-5'>3D</b><b class='flag-5'>目标</b><b class='flag-5'>检测</b>新方法QAF2<b class='flag-5'>D</b>

    三星推出裸眼3D游戏显示器,展出《匹诺曹的谎言》效果

    此款显示器运用置于屏幕顶部的双摄像头制造3D立体效果,可实时追踪使用者的头部与眼球运动,轻松地将二维视频转化为3D效果。试验中,三星在显示器运行的游戏《匹诺曹的谎言》
    的头像 发表于 01-08 14:38 812次阅读

    如何搞定自动驾驶3D目标检测

    可用于自动驾驶场景下基于图像的3D目标检测的数据集总结。其中一些数据集包括多个任务,这里只报告了3D检测基准(例如KITTI
    发表于 01-05 10:43 548次阅读
    如何搞定自动驾驶<b class='flag-5'>3D</b><b class='flag-5'>目标</b><b class='flag-5'>检测</b>!

    ad中3d封装放到哪个层

    设计和制作的过程。它能够增加视觉效果和真实感,使广告更加生动有趣,与众不同。 首先,3D封装在广告中扮演了吸引目标受众的角色。人们通常对新奇的、独特的事物感兴趣,并且容易被视觉上的美感所吸引。通过使用
    的头像 发表于 01-04 15:05 982次阅读

    提供3D打印材料与解决方案,助力3D打印产业发展

    提供3D打印材料与解决方案,助力3D打印产业发展
    的头像 发表于 12-12 11:12 528次阅读