RayDF：实时渲染！基于射线的三维重建新方法-电子发烧友网

方法流程：

图 1 RayDF的整体流程和组成部分

一、Introduction

在机器视觉和机器人领域的许多前沿应用中，学习准确且高效的三维形状表达是十分重要的。然而，现有的基于三维坐标的隐式表达在表示三维形状或是渲染二维图像时，需要耗费昂贵的计算成本；相比之下，基于射线的方法则能够高效地推断出三维形状。但是，已有的基于射线的方法没有考虑到多视角下的几何一致性，以至于在未知视角下难以恢复出准确的几何形状。

针对这些问题，本论文提出一个全新的维护了多视角几何一致性的基于射线的隐式表达方法RayDF。该方法基于简单的射线-表面距离场（ray-surf ace distance field），通过引入全新的双射线可见性分类器（dual-ray visibility classifier）和多视角一致性优化模块（multi-view consistency optimization module），学习得到满足多视角几何一致的射线-表面距离。实验结果表明，改方法在三个数据集上实现了优越的三维表面重建性能，并达到了比基于坐标的方法快1000倍的渲染速度（见Table 1）。

主要贡献如下：

采用射线-表面距离场来表示三维形状，这个表达比现有的基于坐标的表达更高效。

设计了全新的双射线可见性分类器，通过学习任意一对射线的空间关系，使得所学的射线-表面距离场能够在多视角下保持几何一致性。

在多个数据集上证明了该方法在三维形状重建上的准确性和高效性。

二、Method

2.1 Overview

如图1所示，RayDF包含两个网络及一个优化模块。对于主网络ray-surface distance network，只需输入一条射线，即可得到射线起点到射线打到的几何表面点之间的距离值。其中，如图2所示，RayDF使用一个包围三维场景的球对输入的射线进行参数化，将参数化得到的四维球坐标（入射点和出射点）作为网络输入。对于辅助网络dual-ray visibility classifier，输入一对射线和一个几何表面点，预测两条射线之间的相互可见性。这个辅助网络在训练好之后，将在后续multi-view consistency optimization module中起到关键作用。

图 2 射线-表面距离场的射线参数化及网络结构

2.2 Dual-ray Visibility Classifier

该方法中的辅助网络是一个预测输入的两条射线是否能同时看到一个表面点的二元分类器。如图3所示，将输入的两条射线所得特征取平均值，以确保预测的结果不受两条射线的顺序所影响。同时，将表面点进行单独编码得到的特征拼接在射线特征之后，以增强射线特征，从而提升分类器的准确性。

图 3 双射线可见性分类器的框架结构

2.3 Multi-view Consistency Optimization

以设计的主网络ray-surface distance network和辅助网络dual-ray visibility classifier为铺垫，引入多视角一致性优化这一关键模块，对两个网络进行two-stage训练。

(1) 首先为辅助网络dual-ray visibility classifier构造用于训练的射线对。对于一张图片中的一条射线（对应图片中的一个像素），通过其ray-surface distance可知对应的空间表面点，将其投影到训练集中的剩余视角下，即得到另一个射线；而该射线有其对应的ray- surface distance，文章设置阈值10毫米来判断两条射线是否相互可见。

(2) 第二阶段是训练主网络ray-surface distance network使其预测的距离场满足多视角一致性。如图4所示，对于一条主射线及其表面点，以该表面点为球心均匀采样，得到若干条multi-view ray。将主射线与这些multi-view ray一一配对，通过训练好的dual-ray visibility classifier即可得到其相互可见性。再通过ray-surface distance network预测这些射线的ray-surface distance；若主射线与某一条采样射线是相互可见的，那么两条射线的ray-surface distances计算得到的表面点应是同一个点；依此设计了对应的损失函数，并对主网络进行训练，最终可以使ray-surface distance field满足多视角一致性。

图 4 多视角射线采样

2.4 Surface Normal Derivation and Outlier Points Removal

由于在场景表面边缘处的深度值往往存在突变（存在不连续性），而神经网络又是连续函数，上述ray-surface distance field在表面边缘处容易预测出不够准确的距离值，从而导致边缘处的几何表面存在噪声。好在，设计的ray-surface distance field有一个很好的特性，如图5所示，每个估计的三维表面点的法向量都可以通过网络的自动微分以闭合形式轻松求出。因此，可以在网络推理阶段计算表面点的法向量欧氏距离，若该距离值大于阈值，则该表面点被视作离群点并剔除，从而得到干净的三维重建表面。

图 5 Surface normal计算

三、Experiments

为了验证所提出方法的有效性，本文在三个数据集上进行了实验，分别是object-level的合成数据集Blender [1]、scene-level合成数据集DM-SR [2]、scene-level真实数据集ScanNet [3]。论文选取了七个baselines进行性能对比，其中OF [4]/DeepSDF [5]/NDF [6]/NeuS [7]是基于坐标的level-set方法、DS-NeRF [8]是有depth监督的NeRF-based方法，LFN [9]和PRIF [10]是基于射线的两个baselines。

由于RayDF方法很容易直接增加一个radiance分支来学习纹理，从而和上述支持预测radiance field的baselines进行比较。因此，论文对比实验分为两组，其中，Group 1只预测distances （几何），Group 2同时预测distances和radiances（几何和纹理）。

3.1 Evaluation on Blender Dataset

从Table 2和图6可以看出，在Group 1和2中，RayDF在表面重建上取得了更优的结果，尤其是在最重要的 ADE 指标上明显优于基于坐标和射线的baselines。同时在radiance field rendering上，RayDF也取得了与DS-NeRF相当的性能，并优于LFN和PRIF。

图 6 Blender数据集可视化对比

3.2 Evaluation on DM-SR Dataset

从Table 3可以看出，在最关键的 ADE 指标上，RayDF超越了所有baselines。同时，在Group 2的实验中，RayDF能够在获得高质量的新视图合成的同时，保证恢复出准确的表面形状（见图7）。

图 7 DM-SR数据集可视化对比

3.3 Evaluation on ScanNet Dataset

Table 4比较了RayDF和baselines在具有挑战性的真实世界场景中的性能。在Group 1和2中，RayDF在几乎所有评估指标上都明显优于baselines，展示出了在恢复复杂的真实世界三维场景方面的明显优势。

图 8 ScanNet数据集可视化对比

3.4 Ablation Study

论文在Blender数据集上进行了消融实验，其中Table 5展示了在十分关键的dual-ray visibility classifier上的消融实验结果。

如Table 5 (1)所示，如果没有dual-ray visibility classifier的帮助，ray-surface distance field则会无法对新视角下的射线预测出合理的距离值（见图9）。

在classifier的输入中，选择了输入表面点坐标来作为辅助，如Table 5 (2)和(3)所示，若选择输入表面点距离值作为辅助或是不提供辅助信息，分类器会获得较低的准确率和F1分数，导致为ray-surface distance network提供的可见性信息不够准确，进而预测出错误的距离值。

如Table 5 (4)所示，以非对称的方式输入一对射线，所训练得到的分类器准确率较高，但F1分数较低。这表明，这种分类器的鲁棒性明显低于用对称输入射线训练的分类器。

其他ablations可在论文及论文附录中查看。

图 9 使用与不使用分类器的可视化对比

四、Conclusion

总的来说，论文证明了通过使用基于射线的多视角一致性框架，确实可以高效、准确地学习三维形状表示。论文使用简单的射线-表面距离场来表示三维形状几何图形，并通过新颖的双射线可见性分类器进一步实现多视角几何一致性。在多个数据集上都证明了RayDF方法具有极高的渲染效率和出色的性能。欢迎进一步对RayDF框架进行扩展。更多可视化结果可在主页查看：

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器人

机器人

+关注

关注
212

文章
29062

浏览量
210230
机器视觉

机器视觉

+关注

关注
163

文章
4461

浏览量
121464
数据集

数据集

+关注

关注
4

文章
1217

浏览量
25083

原文标题：NeurIPS 2023 | RayDF：实时渲染！基于射线的三维重建新方法

文章出处：【微信号：CVer，微信公众号：CVer】欢迎添加关注！文章转载请注明出处。

怎样去设计一种基于RGB-D相机的三维重建无序抓取系统？

为什么要开发一种三维重建无序抓取系统？三维重建无序抓取系统是由哪些部分组成的？三维重建无序抓取系统有哪些关键技术和创新点？

发表于 07-02 06:29

如何去开发一款基于RGB-D相机与机械臂的三维重建无序抓取系统

基于RGB-D相机与机械臂的三维重建无序抓取系统有哪些关键技术？如何去开发一款基于RGB-D相机与机械臂的三维重建无序抓取系统？基于RGB-D相机与机械臂的三维重建无序抓取系统是由哪些部分组成的？

发表于 09-08 06:12

无人机三维建模的信息

项目需要调研一下无人机三维建模的信息无人机三维建模核心技术是三维重建，或者说基于图片的建模（Image-Based Modeling）。项目需要是建立园区的三维模型，其他应用上可以用于

发表于 09-16 06:55

基于激光扫描仪的树干三维重建方法研究

本文介绍了一种利用三维激光扫描仪，对树木枝干进行三维重建的方法。首先利用激光扫描仪获取一系列树木枝干的坐标数据，继而通过筛选这些数据来重建一系列树木枝干的片

发表于 01-22 11:58 •31次下载

MC三维重建算法的二义性消除研究

面绘制法进行三维重建是三维重建技术的主要方法，Marching Cubes(移动立方体)算法是经典的面绘制法。本文在剖析了MC 算法的基础上，针对其存在的二义性问题，给出了消除二义性

发表于 01-22 12:02 •21次下载

基于FPGA的医学图像三维重建系统设计与实现

目前大部分的医学图像三维重建过程都是在PC机上完成的，由于PC机本身性能的限制和重建算法的复杂性，使得重建效率不高。针对这个问题，设计与实现了一个基于FPGA（Field Programmable Gate Array，现场可编

发表于 03-15 13:52 •44次下载

基于MC算法的光刻仿真微结构的三维重建_宫珊珊

基于MC算法的光刻仿真微结构的三维重建_宫珊珊

发表于 03-18 09:06 •0次下载

为什么说三维重建才是计算机视觉的灵魂?

权龙教授为我们介绍了三维重建的历史发展与应用前景。

发表于 07-02 14:18 •3.1w次阅读

透明物体的三维重建研究综述

应用在透明物体上。文中简要介绍透明物体的三维重建相关研究，围绕从ⅹ恢复形状、反向渲染技术、断层摄影技术和直接光线测量这4个方面回顾了近些年来的主要研究工作，分析并指出当前工作的优缺点以及不同的应用环境，展示

发表于 04-21 14:21 •4次下载

基于分布式传感的实时三维重建系统

基于分布式传感的实时三维重建系统

发表于 06-25 11:25 •15次下载

NVIDIA Omniverse平台助力三维重建服务协同发展

计算机视觉的进步为元宇宙的数字孪生应用打下坚实基础。在计算机视觉中，三维重建是指根据单视图或者多视图的图像重建三维信息的过程。数字孪生开发者可借助三维重建服务，加速 3D 模型构建，提

发表于 10-13 09:45 •1309次阅读

深度学习背景下的图像三维重建技术进展综述

根据三维模型的表示形式可以将图像三维重建方法分类为基于体素的三维重建、基于点云的三维重建和基于网格的三维

发表于 01-09 14:26 •2941次阅读

三维重建：从入门到入土

经典三维重建系统的整个pipeline从相机标定、基础矩阵与本质矩阵估计、特征匹配到运动恢复结构（SFM），从SFM到稠密点云重建、表面重建、纹理贴图。熟悉SFM的工程师已经是行业内的佼佼者，能掌握

发表于 03-03 10:17 •1375次阅读

如何实现整个三维重建过程

在计算机视觉中，三维重建是指根据单视图或者多视图的图像重建三维信息的过程。由于单视频的信息不完全，因此三维重建需要利用经验知识，而多视图的三维重建

发表于 09-01 11:06 •1932次阅读

基于光学成像的物体三维重建技术研究

三维重建的一种重要方法，具有成本低、精度高等优点，因此越来越受到人们的关注和青睐。本文就基于光学成像的物体三维重建技术进行研究和探讨。

发表于 09-15 09:29 •1050次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

RayDF：实时渲染！基于射线的三维重建新方法

评论