使用RayDF方法突破3D形状重建方案-电子发烧友网

1.摘要

传统的三维形状表示方法存在离散化和内存占用等问题，而基于深度学习的方法在恢复三维几何结构方面取得了显著的进展。然而，这些方法的离散形状表示受到空间分辨率和内存占用的限制。因此，本文提出了一种新的三维形状表示方法，即射线-表面距离场（RayDF），通过学习射线与表面之间的距离来表示三维形状。与现有的基于坐标和射线的方法相比，RayDF具有更高的效率和更准确的三维几何重建能力。同时，本文还引入了多视角一致性优化模块，以提高学习到的射线-表面距离场在不同视角下的一致性。通过在多个数据集上的实验证明，RayDF方法在三维形状重建的准确性和效率方面优于现有的方法。

2.研究思路

本研究的研究思路是通过神经网络来学习三维形状的表面距离，并保持多视角一致性。我们提出了一种称为RayDF的方法，它包括三个关键组件：

主要的射线-表面距离网络

辅助的双射线可见性分类器

多视角一致性优化模块

3.贡献

我们采用了直观的射线-表面距离场来表示三维形状，这种表示方法比现有的基于坐标的表示更高效。

我们设计了一种新的双射线可见性分类器，用于学习任意一对射线的空间关系，使学到的射线-表面距离场具有多视角几何一致性。

我们在多个数据集上展示了优越的三维形状重建准确性和效率，相比于现有的基于坐标和基于射线的基线方法，取得了显著更好的结果。

4.研究问题的解决方法

通过训练主要的射线-表面距离网络和辅助的双射线可见性分类器，并引入多视角一致性优化模块来训练这两个网络。具体而言，我们的训练模块包括两个阶段：

阶段1：训练双射线可见性分类器。关键是创建正确的数据对，将原始深度值转换为射线-表面距离值，并生成射线对和0/1标签。采用标准的交叉熵损失函数来优化双射线可见性分类器。

阶段2：训练射线-表面距离网络。将所有深度图像转换为射线-表面距离，为特定的3D场景生成训练射线-距离对。通过采样多视角射线并利用训练好的可见性分类器，优化射线-表面距离网络，使其不仅适应已见射线的距离，还能准确估计未见射线的距离，从而实现多视角一致性。

5.RayDF网络结构和训练过程

网络结构

RayDF模型包括主要的射线-表面距离网络、辅助的双射线可见性分类器和多视角一致性优化模块。

训练过程

第一阶段是训练双射线可见性分类器

首先，将所有原始深度值转换为射线-表面距离值。对于第k张图像中的第i条射线（像素），将其射线-表面点投影回剩余的（K-1）个扫描中，得到相应的（K-1）个距离值。设置10毫米作为接近阈值，确定投影的（K-1）条射线在（K-1）个图像中是否可见。总共生成K* H * W * (K-1)对射线，以及0/1标签。采用标准的交叉熵损失函数来优化双射线可见性分类器。推荐三维重建课程基于深度学习的三维重建MVSNet系列 [论文+源码+应用+科研]

第二阶段是训练射线-表面距离网络

首先，将所有深度图像转换为射线-表面距离，为特定的3D场景生成K * H * W个训练射线-距离对。然后，对于特定的训练射线，称为主射线，我们在以表面点p为球心的球中均匀采样M条射线，称为多视角射线。

然后，计算表面点p与沿着每条多视角射线的边界球之间的距离，得到多视角距离。

接下来，建立M对射线并将它们输入到训练好的可见性分类器中，推断它们的可见性得分。

然后，将主射线和所有采样的M条多视角射线输入到射线-表面距离网络中，估计它们的表面距离。

最后，使用多视角一致性损失函数来（公式如下）优化射线-表面距离网络，使其不仅适应主射线的表面距离，还满足可见的多视角射线也具有准确的距离估计。

6.创新点

主要体现在以下几个方面：

提出了一种新的神经网络模型，称为RayDF，用于学习三维场景的表面距离。与传统的基于点云或体素的方法不同，RayDF利用射线与表面的交点来表示场景的几何形状，从而更准确地捕捉细节和形状变化。

引入了多视角一致性约束，通过训练网络来学习不同视角下的一致性信息。这种约束可以提高模型在新视角下的泛化能力，使其能够更好地处理未见过的场景。

提出了双射线可见性分类器，用于判断射线是否与表面相交。这个分类器可以帮助网络学习更准确的表面距离，并提高模型在测试阶段的性能。

在实验中，本研究在多个真实世界的三维数据集上进行了评估，并与其他基线方法进行了比较。

7.实验方法

本研究采用了两组实验方法进行评估。第一组实验方法是基于多视角深度图像的三维形状表示。在这组实验中，我们使用了多视角深度图像作为输入，通过训练模型来学习三维场景的形状表示。我们与其他基线方法进行了比较，包括OF、DeepSDF、NDF、NeuS、DS-NeRF、LFN和PRIF。通过对六个ScanNet数据集场景的评估，我们发现我们的方法在ADE指标上表现明显优于其他方法，展示了我们方法在显式表面恢复方面的明显优势。第二组实验方法是基于多视角RGB图像和深度图像的三维形状和外观表示。在这组实验中，我们使用了多视角RGB图像和深度图像作为输入，通过训练模型来学习三维场景的形状和外观表示。我们与NeuS、DS-NeRF、LFN和PRIF等基线方法进行了比较。通过对DM-SR数据集的评估，我们发现我们的方法在ADE指标上再次超越了所有基线方法，展示了我们方法在形状恢复方面的优势。同时，我们的方法在PSNR、SSIM和LPIPS等指标上也取得了可比较的性能。

8.结论

本文的研究旨在提出一种称为RayDF的方法，用于准确地表示三维形状。该方法基于射线-表面距离场的概念，通过训练一个主要的射线-表面距离网络和一个辅助的双射线可见性分类器，以及一个多视角一致性优化模块来实现。主要网络直接将射线作为输入，并推断射线起点与其在表面上的击中点之间的距离。辅助网络则以一对射线作为输入，并预测它们的相互可见性。通过训练辅助网络，可以有效地利用学到的双射线可见性来训练主网络，从而使学到的射线-表面距离在任何已见或未见的视角下保持多视角一致性。研究结果表明，相比于现有的基于坐标的表示方法，RayDF方法在效率上具有优势，而相比于现有的基于射线的方法，RayDF方法在学习准确的三维几何形状方面表现出色。在多个数据集上的实验证明了RayDF方法在三维形状重建的准确性和效率方面的优越性。

编辑：黄飞

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4789

浏览量
101597
分类器

分类器

+关注

关注
0

文章
152

浏览量
13283
网络结构

网络结构

+关注

关注
0

文章
48

浏览量
11318
数据集

数据集

+关注

关注
4

文章
1212

浏览量
24990
深度图像

深度图像

+关注

关注
0

文章
19

浏览量
3539

原文标题：香港理工大学最新提出精确3D重建的突破性方法

文章出处：【微信号：3D视觉工坊，微信公众号：3D视觉工坊】欢迎添加关注！文章转载请注明出处。

3d全息风扇灯条|3D全息风扇方案|3d全息风扇PCBA

我公司专业从事3D全息风扇研发生产，主要生产供应3D全息风扇PCBA，也可出售整机，其他配件可免费提供供应商信息或者代购，欢迎咨询刘先生：*** 微信同号3d全息风扇灯条3d全息风扇

发表于 08-02 09:50

PYNQ框架下如何快速完成3D数据重建

来实现基于这些约束的三维重建的完整管道。　　在这个项目中，作者的目标是朝着实时生成3D视觉数据迈进一步。首先，在CPU上生成3D点云，然后使用Mesh Lab可视化它。由于Mesh Lab不适合实时

发表于 01-07 17:25

在Altium Designer创建不寻常的3D形状

在AltiumDesigner®中使用PCB库编辑器中包含的线条拉伸，圆柱和球形形状类型创建逼真的3D机械形状通常非常简单。但是，有些形状可能很棘手。本文是一个客户要求的创建环形线圈

发表于 01-08 07:10

使用结构光的3D扫描介绍

随着很多全新技术的涌现，人们越来越需要用3D方法来表示现实世界中的物体。特别是机器视觉和机器人技术，它们都得益于精确和自适应的3D捕捉功能。其它针对3D扫描的应用包括生物识别、安防、工

发表于 11-16 07:48

光学3D表面轮廓仪可以测金属吗？

重建物体的三维模型。这种测量方式具有非接触性、高精度、高速度等优点，非常适合用于金属等材料的表面测量。光学3D表面轮廓仪可以测量金属的形状、表面缺陷、几何尺寸等多个方面： 1、形状测

发表于 08-21 13:41

创想三维：3D扫描仪在3D打印机上的运用

3D打印机的工作原理产生好奇。什么是3D扫描？ 3D扫描是分析来自现实世界的对象，收集所有数据以便以数字方式重建其形状

发表于 04-19 15:50 •926次阅读

3D的感知技术及实践

测量表面法向量估计几何测量平面提取 3D重建从离散点云得到光滑曲面 3D重建ICP点云配准 3D重建

发表于 10-23 09:40 •3367次阅读

音圈模组3D打印助力肌腱和韧带重建

音圈模组3D打印助力肌腱和韧带重建。BellaSeno是一家开发由可吸收聚合物制成的3D打印乳房重建支架的初创公司，该公司现在已经开始一项计划，旨在设计和评估用于肌腱和韧带

发表于 09-01 14:57 •398次阅读

大规模3D重建的Power Bundle Adjustment

BA (BA) 是一个经典的计算机视觉问题，它构成了许多 3D 重建和运动结构 (SfM) 算法的核心组成部分。它指的是通过最小化非线性重投影误差来联合估计相机参数和 3D 地标位置。

发表于 12-15 11:20 •784次阅读

英伟达提出了同时对未知物体进行6D追踪和3D重建的方法

一种用于新颖未知动态物体的因果 6 自由度姿态跟踪和 3D 重建的新方法。该方法利用了并发跟踪和神经重建过程的新颖共同设计，能够在几乎实时的

发表于 07-03 10:49 •575次阅读

基于未知物体进行6D追踪和3D重建的方法

如今，计算机视觉社区已经广泛展开了对物体姿态的 6D 追踪和 3D 重建。本文中英伟达提出了同时对未知物体进行 6D 追踪和 3D

发表于 07-03 11:24 •696次阅读

基于3D形状重建网络的机器人抓取规划方法

一个带有分割掩码的输入RGB-D图像被提供给两个神经网络，分别产生一个6自由度的抓取姿势和一个物体的3D点云重建。通过将抓取姿势投影到点云中最近的点来优化抓取姿势，从而产生最终的输出抓取。

发表于 11-02 10:39 •523次阅读

使用Python从2D图像进行3D重建过程详解

有许多不同的方法和算法可用于从2D图像执行3D重建。选择的方法取决于诸如输入图像的质量、摄像机校准信息的可用性以及

发表于 12-05 14:07 •3616次阅读

提供3D打印材料与解决方案，助力3D打印产业发展

提供3D打印材料与解决方案，助力3D打印产业发展

发表于 12-12 11:12 •739次阅读

三维扫描与3D打印在法医头骨重建中的突破性应用

随着科技的飞速发展，三维扫描和3D打印技术已经逐渐渗透到医疗领域的各个环节，为临床诊断、治疗和医学研究带来了前所未有的便利。特别是在法医学领域，三维扫描和3D打印技术的应用更是为头骨重建、身份鉴定等

发表于 04-19 10:26 •632次阅读