如何用3D Occupancy处理遮挡问题下的图像匹配？-电子发烧友网

1. 写在前面

图像匹配是SLAM和图像检索的核心任务，但是传统的图像匹配很难处理遮挡问题。今天笔者将为大家分享一篇旷视的开源工作Occ2Net，使用3D Occupancy来解决遮挡问题下的图像匹配。

下面一起来阅读一下这项工作~

2. 摘要

图像匹配是各种视觉应用中基本且关键的任务，如同时定位与地图构建( Simultaneous Localization and Mapping，SLAM )和图像检索，这些应用都需要精确的位姿估计。然而，现有的大多数方法忽略了由相机运动和场景结构引起的物体之间的遮挡关系。在本文中，我们提出了一种新的图像匹配方法Occ2Net，该方法使用3D占有率建模遮挡关系，并在遮挡区域中推断匹配点。得益于占有率估计( Occupancy Estimation，OE )模块中编码的归纳偏差，它大大简化了多视图一致3D表示的引导，从而可以集成来自多个视图的信息。它与一个遮挡感知( Occlusion-Aware，OA )模块一起，结合了注意力层和旋转对齐，以实现遮挡点和可见点之间的匹配。我们在真实世界和模拟数据集上评估了我们的方法，并在几个指标上展示了其优于最先进方法的性能，特别是在遮挡场景中。

3. 效果展示

先看一下问题描述，( a )和( b )是从不同视点拍摄的图像，而( c )显示了遮挡区域的匹配过程。在( c )中，两个显示器显示绿色和红色的掩模，表示在( b )中可见但在( a )中被遮挡的区域。由于相机运动，两个图像的视差很大。虽然存在大量的重叠区域，但大的视差导致了遮挡，很大程度上减少了可见匹配对的数量。通过使用Occ2Net提取一致的占用特征并在( a )和( b )之间进行匹配，( a )中被遮挡的显示器仍然可以在( b )中进行匹配，从而使Occ2Net具备了在遮挡情况下进行匹配的能力。

4. 具体原理是什么？

Occ2Net框架，通过隐式地模拟物体-遮挡关系，实现遮挡下的匹配。首先提取特征，然后应用OA模块获得粗匹配块，最后将精细特征与OE模块中的3D占用估计相结合进行精细匹配。

5. 和其他SOTA方法对比如何？

ScanNet、TartanAir-indoor、TartanAir-outdoor的匹配实例。绿色和黄色线条表示正确匹配，红色线条(误差大于10个像素)为错误匹配。

位姿误差的百分比AUC对比，Occ2Net最优。

6. 总结

这篇文章提出了一种遮挡问题下的图像匹配方式，设计了一种网络结构Occ2Net，可以在一定程度上感知遮挡点的存在。Occ2Net使用特征提取来获得多尺度的全局和位置特征，这些特征有助于猜测遮挡信息。OA模块使用了注意力和旋转对齐，这有助于在后期的由粗到精的过程中得到更多正确的匹配对。OE模块使用3D占用估计结合精细特征进行精细匹配。

审核编辑：黄飞

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

SLAM

SLAM

+关注

关注
23

文章
423

浏览量
31821
图像匹配

图像匹配

+关注

关注
0

文章
21

浏览量
8814

原文标题：如何处理遮挡问题下的图像匹配？

文章出处：【微信号：3D视觉工坊，微信公众号：3D视觉工坊】欢迎添加关注！文章转载请注明出处。

3D LED液晶电视设计方案

的不同图像，简单来说就是2维（2D）的图像根据灰度的差别进行抠像渲染，生成左右眼的两帧图像。　　3.2.2 3D

发表于 07-11 18:05

3D图像的速度控制

你好! 现在我有个问题想请教大家，我怎么做一个3D图像的涡轮扇叶然后通过控制器调整它的速度然后再3D图像中开始转并且根据控制量改变在3D

发表于 11-30 23:25

基于Dragonboard 410c平台的机器3D视觉—摄像机标定原理

和原理，这是我们进行3D视觉处理的基础，在Dragonboard 410c上我们可以方便的用USB摄像头进行图像采集，但是通常我们买的USB摄像头采集到的图像会带有一定的畸变，这些畸变

发表于 09-28 10:32

基于ToF的3D活体检测算法研究

人脸。这是由于目前基于RGB等2D空间的主流活体检测方案未考虑光照、遮挡等干扰因素对于检测的影响，而且存在计算量大的缺点。而数迹智能团队研发的3D SmartToF活体检测方案则可以有效解决此问题。那么

发表于 01-06 07:30

浩辰3D的「3D打印」你会用吗？3D打印教程

设计。由浩辰CAD公司研发的浩辰3D作为从产品设计到制造全流程的高端3D设计软件，不仅能够提供完备的2D+3D一体化解决方案，还能一站式集成3D打印的多元化数据

发表于 05-27 19:05

3D图像的主流技术有哪几种？

3D图像的主流技术有哪几种？Bora传感器的功能亮点是什么？

发表于 05-28 06:37

3D图像生成算法的原理是什么？

什么是3D图形芯片？3D图像生成算法的原理是什么？

发表于 06-04 06:29

基于深度学习和3D图像处理的精密加工件外观缺陷检测系统

检测，检测准确性和检测稳定性较差、容易误判。基于深度学习和3D图像处理的精密加工件外观缺陷检测系统创新性结合深度学习以及3D图像

发表于 03-08 13:59

3D图像引擎,3D图像引擎原理

3D图像引擎,3D图像引擎原理产生的背景和定义随着计算机软、硬件突飞猛进的发展，计算机图形学在各个行业的应用也得

发表于 03-26 15:54 •1465次阅读

平面人物秒变3D模式，图片中的人物可以从平面中“跑出来”，动起来

而在此过程中最主要的挑战是重构后的3D人物与照片中原形人物的轮廓紧密匹配，这事实上非常困难，因为身体可能被部分遮挡，通常被其他身体部分遮挡，比如有人站立时双臂交叉在胸前，这使得机器难以

发表于 12-27 09:15 •1.2w次阅读

iPhone 12没有3D屏幕无法显示3D图像？

最新的iphone 12系列使用后置激光雷达传感器，可以拍摄令人印象深刻的3D照片和扫描图像，但是iPhone 12没有3D屏幕无法显示3D图像

发表于 12-04 14:46 •4310次阅读

谷歌发明的由2D图像生成3D图像技术解析

谷歌发明的由2D图像生成3D图像的技术，利用3D估计神经网络图像信息的补全以及预测，融合了拍摄角

发表于 12-24 12:55 •4760次阅读

华为基于AI技术实现3D图像数字服务

华为3D建模服务（3D Modeling Kit）是华为在图形图像领域又一技术开放，面向有3D模型、动画制作等能力诉求的应用开发者，基于AI技术，提供

发表于 08-12 14:50 •4900次阅读

用于3D扫描的嵌入式图像预处理

电子发烧友网站提供《用于3D扫描的嵌入式图像预处理.zip》资料免费下载

发表于 11-07 10:14 •0次下载

特斯拉的Occupancy Network占用网络如何解决无法识别物体的难题呢？

Occupancy Network并非特斯拉发明，最先提出Occupancy Network的是2018年的论文《Occupancy Networks: Learning 3D Rec

发表于 04-16 17:29 •1793次阅读

搜索历史

如何用3D Occupancy处理遮挡问题下的图像匹配？

评论