英伟达已首次实现SDF实时渲染速度提升2-3个数量级-电子发烧友网

“实时渲染”主要应用于游戏领域，它能够将图形数据实时转化为极具真实感的 3D 画面，是决定游戏体验的关键因素之一。

对于实时渲染而言，最大的挑战即是渲染速度。通常来讲，渲染一屏幕的游戏场景的图像，至少要在 1/24 秒以内，才不至于有 “翻 PPT”的感觉。

近日，英伟达发表一项最新研究成果将实时渲染速度提升了 2-3 个数量级。

而在渲染质量上，它也能够更好地处理复杂样式、比例的图形数据，甚至实时同步环境光照可能形成的阴影。

Facebook 与 MIT研究团队在 2019 年推出的 DeepSDF，是现有相关研究的最佳 3D 重建模型。

与之相比，无论是在渲染速度，还是质量方面，英伟达的最新研究还要更胜一筹。

橙色代表 DeepSDF 渲染效果

这项最新研究是一篇名为《神经几何细节水平：隐式 3D 形状的实时渲染》的论文，它是英伟达联合多伦多大学、麦吉尔大学研究人员共同发表的研究成果，目前已提交至预印论文库 arXiv。

论文中，研究人员表示，他们通过引入了一种高效的神经网络表示方法，首次实现了基于 SDF 的 3D 高保真实时渲染，同时达到了最先进的几何重建质量。更重要的是，与其他研究相比，它在渲染速度上提升了 2-3 个数量级。

SVO 编码，渲染速度翻倍

SDF，即符号距离函数 Signed Distance Function，是计算机图形学中一种有效的表示方法。

在现有研究中，通常是采用一个较大、具有固定尺寸的多层感知器（MLP）对 SDF 进行编码，以近似代表具有隐式曲面的复杂图形。然而，使用大型网络进行实时渲染导致了昂贵的计算成本，因为它需要让每个像素通过网络地进行向前传递。

基于此，研究团队提出了改用稀疏体素八叉树（SVO）来对几何形状进行编码的方法，它可以自适应地缩放不同的离散细节层次 LOD（ Level of Detail ），并重建高度细节的几何结构。

如图，该方法在不同尺寸的几何体之间平滑地插值，并占用合理内存进行实时渲染。

研究人员介绍，与现有研究一样，他们同样使用了一个小型 MLP 来实现球体跟踪。并且受到经典曲面提取机制的启发，使用了存储距离值的正交和空间数据结构对欧几里德空间进行精细离散化，以使简单的线性基函数可以重建几何体。

在这些工作中，分辨率或树深度决定了 LOD（不同的 LOD 可以与 SDF 插值进行混合）。对此，研究人员使用了稀疏体素八叉树（SVO）来离散空间，并存储学习的特征向量，而不是符号距离值。

这样做的好处是，它允许向量可以通过浅层 MLP 解码成标量距离，在继承经典方法（如 LOD）优点的同时，能够进一步缩短树深度。

在此基础上，研究人员还开发了一种针对该体系结构的光线遍历算法（ Rray Traversal Algorithm），实现了比 DeepSDF 快 100 倍的渲染速度。另外，虽然无法与神经体积绘制方法进行直接比较，但在类似的实验环境中，其帧速度也要比 NeRF 快 500 倍，比 NSVF 快 50 倍。

实验测试，渲染质量更精细

在质量上，研究人员将该方法与 DeepSDF、FFN、SIREN 以及 Neural Implicits（NI）四种算法进行了比较，它们在过度拟合 3D 几何形状方面均达到了现有研究的最佳性能。

以下为不同算法在 ShapeNet、Thingi10K 和 TurboSquid 三个数据集上进行 3D 重建的比较结果。