0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RayDF:实时渲染!基于射线的三维重建新方法

CVer 来源:CVer 2023-11-17 16:23 次阅读

方法流程:

3053d982-851e-11ee-939d-92fbcf53809c.jpg

图 1 RayDF的整体流程和组成部分

一、Introduction

机器视觉机器人领域的许多前沿应用中,学习准确且高效的三维形状表达是十分重要的。然而,现有的基于三维坐标的隐式表达在表示三维形状或是渲染二维图像时,需要耗费昂贵的计算成本;相比之下,基于射线的方法则能够高效地推断出三维形状。但是,已有的基于射线的方法没有考虑到多视角下的几何一致性,以至于在未知视角下难以恢复出准确的几何形状。

针对这些问题,本论文提出一个全新的维护了多视角几何一致性的基于射线的隐式表达方法RayDF。该方法基于简单的射线-表面距离场(ray-surface distance field),通过引入全新的双射线可见性分类器(dual-ray visibility classifier)和多视角一致性优化模块(multi-view consistency optimization module),学习得到满足多视角几何一致的射线-表面距离。实验结果表明,改方法在三个数据集上实现了优越的三维表面重建性能,并达到了比基于坐标的方法快1000倍的渲染速度(见Table 1)。

305b7700-851e-11ee-939d-92fbcf53809c.png

主要贡献如下:

采用射线-表面距离场来表示三维形状,这个表达比现有的基于坐标的表达更高效。

设计了全新的双射线可见性分类器,通过学习任意一对射线的空间关系,使得所学的射线-表面距离场能够在多视角下保持几何一致性。

在多个数据集上证明了该方法在三维形状重建上的准确性和高效性。

二、Method

2.1 Overview

如图1所示,RayDF包含两个网络及一个优化模块。对于主网络ray-surface distance network,只需输入一条射线,即可得到射线起点到射线打到的几何表面点之间的距离值。其中,如图2所示,RayDF使用一个包围三维场景的球对输入的射线进行参数化,将参数化得到的四维球坐标(入射点和出射点)作为网络输入。对于辅助网络dual-ray visibility classifier,输入一对射线和一个几何表面点,预测两条射线之间的相互可见性。这个辅助网络在训练好之后,将在后续multi-view consistency optimization module中起到关键作用。

3068e35e-851e-11ee-939d-92fbcf53809c.jpg

图 2 射线-表面距离场的射线参数化及网络结构

2.2 Dual-ray Visibility Classifier

该方法中的辅助网络是一个预测输入的两条射线是否能同时看到一个表面点的二元分类器。如图3所示,将输入的两条射线所得特征取平均值,以确保预测的结果不受两条射线的顺序所影响。同时,将表面点进行单独编码得到的特征拼接在射线特征之后,以增强射线特征,从而提升分类器的准确性。

3076926a-851e-11ee-939d-92fbcf53809c.jpg

图 3 双射线可见性分类器的框架结构

2.3 Multi-view Consistency Optimization

以设计的主网络ray-surface distance network和辅助网络dual-ray visibility classifier为铺垫,引入多视角一致性优化这一关键模块,对两个网络进行two-stage训练。

(1) 首先为辅助网络dual-ray visibility classifier构造用于训练的射线对。对于一张图片中的一条射线(对应图片中的一个像素),通过其ray-surface distance可知对应的空间表面点,将其投影到训练集中的剩余视角下,即得到另一个射线;而该射线有其对应的ray- surface distance,文章设置阈值10毫米来判断两条射线是否相互可见。

(2) 第二阶段是训练主网络ray-surface distance network使其预测的距离场满足多视角一致性。如图4所示,对于一条主射线及其表面点,以该表面点为球心均匀采样,得到若干条multi-view ray。将主射线与这些multi-view ray一一配对,通过训练好的dual-ray visibility classifier即可得到其相互可见性。再通过ray-surface distance network预测这些射线的ray-surface distance;若主射线与某一条采样射线是相互可见的,那么两条射线的ray-surface distances计算得到的表面点应是同一个点;依此设计了对应的损失函数,并对主网络进行训练,最终可以使ray-surface distance field满足多视角一致性。

3081dcba-851e-11ee-939d-92fbcf53809c.jpg

图 4 多视角射线采样

2.4 Surface Normal Derivation and Outlier Points Removal

由于在场景表面边缘处的深度值往往存在突变(存在不连续性),而神经网络又是连续函数,上述ray-surface distance field在表面边缘处容易预测出不够准确的距离值,从而导致边缘处的几何表面存在噪声。好在,设计的ray-surface distance field有一个很好的特性,如图5所示,每个估计的三维表面点的法向量都可以通过网络的自动微分以闭合形式轻松求出。因此,可以在网络推理阶段计算表面点的法向量欧氏距离,若该距离值大于阈值,则该表面点被视作离群点并剔除,从而得到干净的三维重建表面。

308e6408-851e-11ee-939d-92fbcf53809c.png

图 5 Surface normal计算

三、Experiments

为了验证所提出方法的有效性,本文在三个数据集上进行了实验,分别是object-level的合成数据集Blender [1]、scene-level合成数据集DM-SR [2]、scene-level真实数据集ScanNet [3]。论文选取了七个baselines进行性能对比,其中OF [4]/DeepSDF [5]/NDF [6]/NeuS [7]是基于坐标的level-set方法、DS-NeRF [8]是有depth监督的NeRF-based方法,LFN [9]和PRIF [10]是基于射线的两个baselines。

由于RayDF方法很容易直接增加一个radiance分支来学习纹理,从而和上述支持预测radiance field的baselines进行比较。因此,论文对比实验分为两组,其中,Group 1只预测distances (几何),Group 2同时预测distances和radiances(几何和纹理)。

3.1 Evaluation on Blender Dataset

从Table 2和图6可以看出,在Group 1和2中,RayDF在表面重建上取得了更优的结果,尤其是在最重要的 ADE 指标上明显优于基于坐标和射线的baselines。同时在radiance field rendering上,RayDF也取得了与DS-NeRF相当的性能,并优于LFN和PRIF。

309b86ce-851e-11ee-939d-92fbcf53809c.png

30a90150-851e-11ee-939d-92fbcf53809c.png

图 6 Blender数据集可视化对比

3.2 Evaluation on DM-SR Dataset

从Table 3可以看出,在最关键的 ADE 指标上,RayDF超越了所有baselines。同时,在Group 2的实验中,RayDF能够在获得高质量的新视图合成的同时,保证恢复出准确的表面形状(见图7)。

30c6fd36-851e-11ee-939d-92fbcf53809c.png

30d66e1a-851e-11ee-939d-92fbcf53809c.png

图 7 DM-SR数据集可视化对比

3.3 Evaluation on ScanNet Dataset

Table 4比较了RayDF和baselines在具有挑战性的真实世界场景中的性能。在Group 1和2中,RayDF在几乎所有评估指标上都明显优于baselines,展示出了在恢复复杂的真实世界三维场景方面的明显优势。

30e98d24-851e-11ee-939d-92fbcf53809c.png

3104ab54-851e-11ee-939d-92fbcf53809c.png

图 8 ScanNet数据集可视化对比

3.4 Ablation Study

论文在Blender数据集上进行了消融实验,其中Table 5展示了在十分关键的dual-ray visibility classifier上的消融实验结果。

如Table 5 (1)所示,如果没有dual-ray visibility classifier的帮助,ray-surface distance field则会无法对新视角下的射线预测出合理的距离值(见图9)。

在classifier的输入中,选择了输入表面点坐标来作为辅助,如Table 5 (2)和(3)所示,若选择输入表面点距离值作为辅助或是不提供辅助信息,分类器会获得较低的准确率和F1分数,导致为ray-surface distance network提供的可见性信息不够准确,进而预测出错误的距离值。

如Table 5 (4)所示,以非对称的方式输入一对射线,所训练得到的分类器准确率较高,但F1分数较低。这表明,这种分类器的鲁棒性明显低于用对称输入射线训练的分类器。

其他ablations可在论文及论文附录中查看。

31106570-851e-11ee-939d-92fbcf53809c.png

3117ba14-851e-11ee-939d-92fbcf53809c.png

图 9 使用与不使用分类器的可视化对比

四、Conclusion

总的来说,论文证明了通过使用基于射线的多视角一致性框架,确实可以高效、准确地学习三维形状表示。论文使用简单的射线-表面距离场来表示三维形状几何图形,并通过新颖的双射线可见性分类器进一步实现多视角几何一致性。在多个数据集上都证明了RayDF方法具有极高的渲染效率和出色的性能。欢迎进一步对RayDF框架进行扩展。更多可视化结果可在主页查看:

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    28053

    浏览量

    205724
  • 机器视觉
    +关注

    关注

    161

    文章

    4315

    浏览量

    119940
  • 数据集
    +关注

    关注

    4

    文章

    1200

    浏览量

    24606

原文标题:​NeurIPS 2023 | RayDF:实时渲染!基于射线的三维重建新方法

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    怎样去设计一种基于RGB-D相机的三维重建无序抓取系统?

    为什么要开发一种三维重建无序抓取系统?三维重建无序抓取系统是由哪些部分组成的?三维重建无序抓取系统有哪些关键技术和创新点?
    发表于 07-02 06:29

    如何去开发一款基于RGB-D相机与机械臂的三维重建无序抓取系统

    基于RGB-D相机与机械臂的三维重建无序抓取系统有哪些关键技术?如何去开发一款基于RGB-D相机与机械臂的三维重建无序抓取系统?基于RGB-D相机与机械臂的三维重建无序抓取系统是由哪些部分组成的?
    发表于 09-08 06:12

    无人机三维建模的信息

    项目需要调研一下无人机三维建模的信息无人机三维建模核心技术是三维重建,或者说基于图片的建模(Image-Based Modeling)。项目需要是建立园区的三维模型,其他应用上可以用于
    发表于 09-16 06:55

    基于激光扫描仪的树干三维重建方法研究

    本文介绍了一种利用三维激光扫描仪,对树木枝干进行三维重建方法。首先利用激光扫描仪获取一系列树木枝干的坐标数据,继而通过筛选这些数据来重建一系列树木枝干的片
    发表于 01-22 11:58 31次下载

    MC三维重建算法的二义性消除研究

    面绘制法进行三维重建三维重建技术的主要方法,Marching Cubes(移动立方体)算法是经典的面绘制法。本文在剖析了MC 算法的基础上,针对其存在的二义性问题,给出了消除二义性
    发表于 01-22 12:02 21次下载

    基于FPGA的医学图像三维重建系统设计与实现

    目前大部分的医学图像三维重建过程都是在PC机上完成的,由于PC机本身性能的限制和重建算法的复杂性,使得重建效率不高。针对这个问题,设计与实现了一个基于FPGA(Field Programmable Gate Array,现场可编
    发表于 03-15 13:52 44次下载

    基于MC算法的光刻仿真微结构的三维重建_宫珊珊

    基于MC算法的光刻仿真微结构的三维重建_宫珊珊
    发表于 03-18 09:06 0次下载

    为什么说三维重建才是计算机视觉的灵魂?

    权龙教授为我们介绍了三维重建的历史发展与应用前景。
    的头像 发表于 07-02 14:18 3.1w次阅读

    透明物体的三维重建研究综述

    应用在透明物体上。文中简要介绍透明物体的三维重建相关研究,围绕从ⅹ恢复形状、反向渲染技术、断层摄影技术和直接光线测量这4个方面回顾了近些年来的主要研究工作,分析并指出当前工作的优缺点以及不同的应用环境,展示
    发表于 04-21 14:21 4次下载
    透明物体的<b class='flag-5'>三维重建</b>研究综述

    基于分布式传感的实时三维重建系统

    基于分布式传感的实时三维重建系统
    发表于 06-25 11:25 15次下载

    NVIDIA Omniverse平台助力三维重建服务协同发展

    计算机视觉的进步为元宇宙的数字孪生应用打下坚实基础。在计算机视觉中,三维重建是指根据单视图或者多视图的图像重建三维信息的过程。数字孪生开发者可借助三维重建服务,加速 3D 模型构建,提
    的头像 发表于 10-13 09:45 1125次阅读

    深度学习背景下的图像三维重建技术进展综述

    根据三维模型的表示形式可以将图像三维重建方法分类为基于体素的三维重建、基于点云的三维重建和基于网格的三维
    的头像 发表于 01-09 14:26 2149次阅读

    三维重建:从入门到入土

    经典三维重建系统的整个pipeline从相机标定、基础矩阵与本质矩阵估计、特征匹配到运动恢复结构(SFM),从SFM到稠密点云重建、表面重建、纹理贴图。熟悉SFM的工程师已经是行业内的佼佼者,能掌握
    的头像 发表于 03-03 10:17 1094次阅读

    如何实现整个三维重建过程

    在计算机视觉中,三维重建是指根据单视图或者多视图的图像重建三维信息的过程。由于单视频的信息不完全,因此三维重建需要利用经验知识,而多视图的三维重建
    发表于 09-01 11:06 1575次阅读
    如何实现整个<b class='flag-5'>三维重建</b>过程

    基于光学成像的物体三维重建技术研究

    三维重建的一种重要方法,具有成本低、精度高等优点,因此越来越受到人们的关注和青睐。本文就基于光学成像的物体三维重建技术进行研究和探讨。
    的头像 发表于 09-15 09:29 840次阅读
    基于光学成像的物体<b class='flag-5'>三维重建</b>技术研究