单目深度估计开源方案分享-电子发烧友网

0. 笔者个人体会

单目深度估计网络可以估计RGB图像的稠密深度图，但大家可以发现大多数模型的深度图并不准确，尤其是物体边界的深度值非常模糊。而且很多深度估计模型只能处理分辨率很小的图像，图像一大就模糊。这就会导致SLAM/SfM等任务生成的3D场景的物体边界质量非常差。

今天笔者将为大家分享一项最新的开源工作PatchFusion，可以产生极高分辨率的单目深度图，还可以助力之前的SOTA方案ZoeDepth等网络涨点！

1. 效果展示

可以看一下单目深度估计效果，这个深度图的分辨率是真的高，物体边界分割的非常干净！

2. 具体原理是什么？

PatchFusion是基于图块的框架，具有三个关键组件：

（1）patch式融合网络，通过高层将全局一致的粗略预测与更精细、不一致的图块预测融合到一起；

（2）全局到局部 (G2L) 模块，为融合网络添加重要上下文，无需patch选择启发式方法；

（3）一致性感知训练 (CAT) 和推理 (CAI) 方法，强调patch重叠一致性，从而消除后处理。

3. 和其他SOTA方法对比如何？

分别在UnrealStereo4K、MVS-Synth 和 Middleburry 2014 上做了实验，证明PatchFusion可以生成具有复杂细节的高分辨率深度图。

更重要的一点是，PatchFusion可以增强之前的SOTA方案 ZoeDepth，在 UnrealStereo4K 和 MVS-Synth 上的均方根误差 (RMSE)分别提高了 17.3% 和 29.4%。

审核编辑：黄飞

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

分辨率

分辨率

+关注

关注
2

文章
1028

浏览量
41853
RGB

RGB

+关注

关注
4

文章
796

浏览量
58320
SLAM

SLAM

+关注

关注
23

文章
414

浏览量
31751

原文标题：这绝对是质量最高的单目深度估计开源方案！

文章出处：【微信号：3D视觉工坊，微信公众号：3D视觉工坊】欢迎添加关注！文章转载请注明出处。

单目摄像头和FPGA的ADAS产品原型系统

地平线在软件算法上提供了基于深度学习的整体方案，具有高性能、低运算量的特点。在今年智车优行“奇点汽车”发布会上，地平线首次向外界展示了真车环境下，利用单目摄像头同时实现行人/车辆/车道

发表于 01-06 18:09

Firefly RK3399Pro开源主板 + 单目摄像头，人体特征点检测方案

，可以更智能地应用于计算机视觉的相关领域中。方案搭建Firefly RK3399Pro开源主板 + 单目摄像头方案特点高性能AI处理器采用R

发表于 04-01 15:55

基于单目图像的深度估计算法，大幅度提升基于单目图像深度估计的精度

双目匹配需要把左图像素和右图中其对应像素进行匹配，再由匹配的像素差算出左图像素对应的深度，而之前的单目深度估计方法均不能显式引入类似的几何约

发表于 06-04 15:46 •3.5w次阅读

基于<b class='flag-5'>单</b><b class='flag-5'>目</b>图像的<b class='flag-5'>深度</b><b class='flag-5'>估计</b>算法，大幅度提升基于<b class='flag-5'>单</b><b class='flag-5'>目</b>图像<b class='flag-5'>深度</b><b class='flag-5'>估计</b>的精度

UC Berkeley大学的研究人员们利用深度姿态估计和深度学习技术

器，从单目图像中预测动作。虽然在训练该估计器的时候需要标注动作，不过一旦训练完成，估计器在应用到新图片上时就无需再次训练了。

发表于 10-12 09:06 •2758次阅读

采用自监督CNN进行单图像深度估计的方法

为了提高利用深度神经网络预测单图像深度信息的精确度，提出了一种采用自监督卷积神经网络进行单图像深度估计

发表于 04-27 16:06 •13次下载

ADF2022项目开源

电子发烧友网站提供《ADF2022项目开源.zip》资料免费下载

发表于 07-05 09:42 •2次下载

基于几何单目3D目标检测的密集几何约束深度估计器

基于几何的单目3D目标检测通过2D-3D投影约束估计目标的位置。具体来说，网络预测目标的尺寸()，旋转角。假设一个目标有n个语义关键点，论文回归第i个关键点在图像坐标中的2D坐标和object

发表于 10-09 15:51 •886次阅读

密集单目SLAM的概率体积融合概述

我们提出了一种利用深度密集单目 SLAM 和快速不确定性传播从图像重建 3D 场景的新方法。所提出的方法能够密集、准确、实时地 3D 重建场景，同时对来自密集单

发表于 01-30 11:34 •629次阅读

单目立体视觉：我用单目相机求了个体积！

一般而言，单目是无法依靠自身来完成测量的，有企业选择让单目相机动起来，但是一旦动起来实际上也是双目，不再是单

发表于 03-01 11:19 •978次阅读

一种用于自监督单目深度估计的轻量级CNN和Transformer架构

自监督单目深度估计不需要地面实况训练，近年来受到广泛关注。设计轻量级但有效的模型非常有意义，这样它们就可以部署在边缘设备上。

发表于 03-14 17:54 •2032次阅读

介绍第一个结合相对和绝对深度的多模态单目深度估计网络

单目深度估计分为两个派系，metric depth estimation(度量深度估计，也称绝对

发表于 03-21 18:01 •5043次阅读

使用python和opencv实现单目摄像机测距

我的论文方向目前是使用单目摄像头实现机器人对人的跟随，首先单目摄像头与kinect等深度摄像头最大的区别是无法有效获取

发表于 07-03 10:01 •2865次阅读

一种利用几何信息的自监督单目深度估计框架

本文方法是一种自监督的单目深度估计框架，名为GasMono，专门设计用于室内场景。本方法通过应用多视图几何的方式解决了室内场景中帧间大旋转和低纹理导致自监督

发表于 11-06 11:47 •386次阅读

动态场景下的自监督单目深度估计方案

自监督单目深度估计的训练可以在大量无标签视频序列来进行，训练集获取很方便。但问题是，实际采集的视频序列往往会有很多动态物体，而自监督训练本身就是基于静态环境假设，动态环境下会失效。

发表于 11-28 09:21 •628次阅读