0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

单目深度估计开源方案分享

3D视觉工坊 来源:3D视觉工坊 2023-12-17 10:01 次阅读

0. 笔者个人体会

单目深度估计网络可以估计RGB图像的稠密深度图,但大家可以发现大多数模型的深度图并不准确,尤其是物体边界的深度值非常模糊。而且很多深度估计模型只能处理分辨率很小的图像,图像一大就模糊。这就会导致SLAM/SfM等任务生成的3D场景的物体边界质量非常差。

今天笔者将为大家分享一项最新的开源工作PatchFusion,可以产生极高分辨率的单目深度图,还可以助力之前的SOTA方案ZoeDepth等网络涨点!

1. 效果展示

可以看一下单目深度估计效果,这个深度图的分辨率是真的高,物体边界分割的非常干净!

24a44b0a-9c2d-11ee-8b88-92fbcf53809c.jpg

24b509ae-9c2d-11ee-8b88-92fbcf53809c.jpg

2. 具体原理是什么?

PatchFusion是基于图块的框架,具有三个关键组件:

(1)patch式融合网络,通过高层将全局一致的粗略预测与更精细、不一致的图块预测融合到一起;

(2) 全局到局部 (G2L) 模块,为融合网络添加重要上下文,无需patch选择启发式方法;

(3) 一致性感知训练 (CAT) 和推理 (CAI) 方法,强调patch重叠一致性,从而消除后处理。

24b8ef1a-9c2d-11ee-8b88-92fbcf53809c.jpg

3. 和其他SOTA方法对比如何?

分别在UnrealStereo4K、MVS-Synth 和 Middleburry 2014 上做了实验,证明PatchFusion可以生成具有复杂细节的高分辨率深度图。

更重要的一点是,PatchFusion可以增强之前的SOTA方案 ZoeDepth,在 UnrealStereo4K 和 MVS-Synth 上的均方根误差 (RMSE)分别提高了 17.3% 和 29.4%。

24c91eb2-9c2d-11ee-8b88-92fbcf53809c.jpg

审核编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 分辨率
    +关注

    关注

    2

    文章

    1028

    浏览量

    41853
  • RGB
    RGB
    +关注

    关注

    4

    文章

    796

    浏览量

    58320
  • SLAM
    +关注

    关注

    23

    文章

    414

    浏览量

    31751

原文标题:这绝对是质量最高的单目深度估计开源方案!

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    摄像头和FPGA的ADAS产品原型系统

    地平线在软件算法上提供了基于深度学习的整体方案,具有高性能、低运算量的特点。在今年智车优行“奇点汽车”发布会上,地平线首次向外界展示了真车环境下,利用摄像头同时实现行人/车辆/车道
    发表于 01-06 18:09

    Firefly RK3399Pro开源主板 + 摄像头,人体特征点检测方案

    ,可以更智能地应用于计算机视觉的相关领域中。方案搭建Firefly RK3399Pro开源主板 + 摄像头方案特点高性能AI处理器采用R
    发表于 04-01 15:55

    基于深度估计的红外图像彩色化方法_戈曼

    基于深度估计的红外图像彩色化方法_戈曼
    发表于 03-17 10:13 0次下载

    基于图像的深度估计算法,大幅度提升基于图像深度估计的精度

    双目匹配需要把左图像素和右图中其对应像素进行匹配,再由匹配的像素差算出左图像素对应的深度,而之前的深度估计方法均不能显式引入类似的几何约
    的头像 发表于 06-04 15:46 3.5w次阅读
    基于<b class='flag-5'>单</b><b class='flag-5'>目</b>图像的<b class='flag-5'>深度</b><b class='flag-5'>估计</b>算法,大幅度提升基于<b class='flag-5'>单</b><b class='flag-5'>目</b>图像<b class='flag-5'>深度</b><b class='flag-5'>估计</b>的精度

    UC Berkeley大学的研究人员们利用深度姿态估计深度学习技术

    器,从图像中预测动作。虽然在训练该估计器的时候需要标注动作,不过一旦训练完成,估计器在应用到新图片上时就无需再次训练了。
    的头像 发表于 10-12 09:06 2758次阅读

    采用自监督CNN进行图像深度估计的方法

    为了提高利用深度神经网络预测图像深度信息的精确度,提出了一种采用自监督卷积神经网络进行图像深度估计
    发表于 04-27 16:06 13次下载
    采用自监督CNN进行<b class='flag-5'>单</b>图像<b class='flag-5'>深度</b><b class='flag-5'>估计</b>的方法

    ADF2022项开源

    电子发烧友网站提供《ADF2022项开源.zip》资料免费下载
    发表于 07-05 09:42 2次下载
    ADF2022项<b class='flag-5'>目</b><b class='flag-5'>开源</b>

    基于几何3D目标检测的密集几何约束深度估计

    基于几何的3D目标检测通过2D-3D投影约束估计目标的位置。具体来说,网络预测目标的尺寸(),旋转角。假设一个目标有n个语义关键点,论文回归第i个关键点在图像坐标中的2D坐标和object
    的头像 发表于 10-09 15:51 886次阅读

    密集SLAM的概率体积融合概述

    我们提出了一种利用深度密集 SLAM 和快速不确定性传播从图像重建 3D 场景的新方法。所提出的方法能够密集、准确、实时地 3D 重建场景,同时对来自密集
    的头像 发表于 01-30 11:34 629次阅读

    立体视觉:我用相机求了个体积!

    一般而言,是无法依靠自身来完成测量的,有企业选择让相机动起来,但是一旦动起来实际上也是双目,不再是
    的头像 发表于 03-01 11:19 978次阅读

    一种用于自监督深度估计的轻量级CNN和Transformer架构

    自监督深度估计不需要地面实况训练,近年来受到广泛关注。设计轻量级但有效的模型非常有意义,这样它们就可以部署在边缘设备上。
    的头像 发表于 03-14 17:54 2032次阅读

    介绍第一个结合相对和绝对深度的多模态深度估计网络

    深度估计分为两个派系,metric depth estimation(度量深度估计,也称绝对
    的头像 发表于 03-21 18:01 5043次阅读

    使用python和opencv实现摄像机测距

    我的论文方向目前是使用摄像头实现机器人对人的跟随,首先摄像头与kinect等深度摄像头最大的区别是无法有效获取
    的头像 发表于 07-03 10:01 2865次阅读
    使用python和opencv实现<b class='flag-5'>单</b><b class='flag-5'>目</b>摄像机测距

    一种利用几何信息的自监督深度估计框架

    本文方法是一种自监督的深度估计框架,名为GasMono,专门设计用于室内场景。本方法通过应用多视图几何的方式解决了室内场景中帧间大旋转和低纹理导致自监督
    发表于 11-06 11:47 386次阅读
    一种利用几何信息的自监督<b class='flag-5'>单</b><b class='flag-5'>目</b><b class='flag-5'>深度</b><b class='flag-5'>估计</b>框架

    动态场景下的自监督深度估计方案

    自监督深度估计的训练可以在大量无标签视频序列来进行,训练集获取很方便。但问题是,实际采集的视频序列往往会有很多动态物体,而自监督训练本身就是基于静态环境假设,动态环境下会失效。
    发表于 11-28 09:21 628次阅读
    动态场景下的自监督<b class='flag-5'>单</b><b class='flag-5'>目</b><b class='flag-5'>深度</b><b class='flag-5'>估计</b><b class='flag-5'>方案</b>