0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

最新NVIDIA OptiX渲染光线跟踪的速度增快

星星科技指导员 来源:NVIDIA 作者:Tony Kanell 2022-04-15 15:17 次阅读

NVIDIA OptiX 射线跟踪引擎是一个可扩展的无缝框架,可在 GPU 上提供最佳的射线跟踪性能。在今年秋季更新英伟达 OpTIX SDK ,开发人员将能够利用新的编译技术,和优越的分层和时间去噪处理更多的射线跟踪工作负荷,更快。

更快的编译时间

NVIDIA OptiX 7. 4 附带了一项新功能,支持包含多个函数的 OptixModule 对象的并行编译。工作被表示为从 API 返回的任务对象,可以并发执行以实现并行性。当发现并行机会时,将返回其他任务。线程在 NVIDIA OptiX 之外通过从应用程序管理的线程执行任务来处理。该应用程序可以更容易地将并行工作集成到现有的作业调度器中。

改进的定制和性能

NVIDIA OptiX 7.4 已将光线有效载荷的大小从 8 个寄存器增加到 32 个寄存器。有效负载寄存器是 NVIDIA OptiX 提供的机制,用于从跟踪光线的调用方传递任意数据以及光线。这种有效负载机制非常轻量级,类似于向函数传递参数。有效负载的有限大小迫使许多人使用本地甚至全局内存缓冲区来传递光线数据,这可能会对性能产生负面影响。

新的有效负载大小提供了更多种类的应用程序,以便能够利用仅使用寄存器传递数据的优势。使用更多寄存器会增加寄存器压力,并可能导致内存溢出,因此新的 NVIDIA OptiX 7 . 4 有效负载增加还附带了新的 API 函数。这将帮助开发人员优化有效负载的使用。新的 API 允许您声明如何使用有效负载值,以便编译器有机会尽可能重用寄存器。

曲线添加和优化

我们还引入了一个新的曲线原语: Catmull-Rom 三次曲线。这种类型的曲线是直接通过其控制点的插值曲线的一种流行样式,用于在需要精度控制时微调曲线的放置。 Catmull Rom 曲线是电影和游戏行业头发、毛皮和其他曲线用途的流行选择。 NVIDIA OptiX 已经支持的其他曲线类型是三次和二次 B 样条曲线以及线性曲线。 B 样条曲线是一种近似曲线,比 Catmull Rom 曲线稍微平滑,但通常也不会直接通过其控制点。

除了新的曲线原语外, NVIDIA OptiX 还添加了一个选项,用于控制三次曲线和二次曲线的端点是开放的还是封闭的。为了避免着色器发散(与 endcap 法线的特殊情况处理有关),需要使用开放式曲线。 NVIDIA OptiX 曲线当前是背面消隐的,因此通过曲线开口端进入的光线将完全错过曲线。开放式曲线是常见的和可取的,而且性能更好。 NVIDIA OptiX 7.4 将三次曲线和二次曲线的默认端盖行为更改为开放式。

以前,这些曲线具有扁平闭合的圆盘形端盖,这对于需要仔细控制光线曲线行为或防止光线通过曲线的应用程序有时非常有用。为了节省内存, B 样条曲线和 Catmull Rom 曲线沿连接的线束段共享控制点。

说到节省内存, NVIDIA OptiX 7 . 4 启用了曲线自适应采样,这在默认情况下既减少了内存又提高了性能。对于拥有数百万条曲线的毛茸茸的生物来说,内存使用是至关重要的。对于最注重性能且内存可用的生物来说,使用构建标志 OPTIX \ u build \ u flag \ u prefere \ u FAST \ u TRACE 可以更快地渲染曲线。自适应采样使用的内存比以前稍微多一些(大约 10% ),以换取渲染性能平均提高 25%-50% ,甚至在我们的一些测试中提高 70% 。

两个主要的去噪功能结合在一起

NVIDIA OptiX 7.4 中的去噪器在质量和速度上不断提高。有了这个版本的 NVIDIA OptiX ,开发人员可以结合前面两个主要的去噪功能升级: AOV (或分层)去噪和时间去噪。 AOV 去噪是同时对多个任意渲染层进行去噪的功能,与单独对每个层进行去噪相比, AOV 去噪具有更好的效率。此外,同时对多个层进行去噪可以显著提高质量,因为所有层的去噪滤波器选择保持一致。这意味着,一旦将层重新组合在一起,可以看到较少的去噪伪影。

对单独的层进行去噪会导致为每个层独立选择不同的过滤器,并且会使某些层更容易出现可见的瑕疵。这对于非常稀疏的层尤其如此,例如大部分为空的镜面反射过程。时间去噪是 NVIDIA OptiX 7.3 的一项新功能,它可以在动画帧序列中保持帧间去噪的一致性。如果单独对帧进行去噪,它们可能看起来很不错,但是当您对它们进行动画播放时,通常会出现闪烁的瑕疵,因为去噪器会对每个帧进行独立的选择。时间 AOV 去噪在一个包中为您提供了两个功能—在不同层和动画序列中的去噪一致性。

随着需求量的增加,规模不断扩大

NVIDIA OptiX 中的 demand loading library 具有缓存逐出功能,用于动态替换缓存的磁贴,以节省更多内存。团队正在寻求需求加载库中的这个新功能的反馈,所以如果你使用它,请通过我们的英伟达论坛here或通过电子邮件来访问,让 Nvidia OpTIX 团队知道它对你的工作有多好。将按需加载库逐出功能带到生产就绪状态,并计划在未来版本的 NVIDIA OptiX 中进行其他改进。

关于作者

Tony Kanell 是 NVIDIA OptiX 团队的项目经理。托尼的职业生涯始于电子艺术公司的软件工程师,致力于模拟人生等 AAA 级游戏。在与一家由 WME 支持的创意机构合作创办新游戏工作室之前,他在该公司担任管理职务,并领导了几个项目。在与 Nickelodeon 、孩之宝、 Universal 、 Laika 和多个原创 IP 成功发布和合作发布后,他加入了 NVIDIA 的 OptiX 团队,在那里他帮助团队完成了多个发布。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4981

    浏览量

    103000
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4729

    浏览量

    128903
收藏 人收藏

    评论

    相关推荐

    使用NVIDIA Omniverse丰富汽车营销资产

    Katana Studio 的艺术家和开发人员通过将艺术与技术相结合,为各个品牌制作高保真 CGI 图像和数字体验。最近,该团队使用NVIDIA Omniverse SDK 和 API开发了自己
    的头像 发表于 11-27 11:20 267次阅读

    基于光线追踪的渲染算法实现

    我们已经涵盖了所有需要说的内容!我们现在准备写我们的第一个光线追踪器。你现在应该能够猜到光线追踪算法是如何工作的了。首先,注意到自然界中光的传播只是从光源发出无数条射线,反弹直到它们撞到我们眼睛的表面。因此,光线追踪是优雅的,因
    的头像 发表于 10-30 08:06 248次阅读
    基于<b class='flag-5'>光线</b>追踪的<b class='flag-5'>渲染</b>算法实现

    AMD与NVIDIA GPU优缺点

    NVIDIA的RTX系列显卡以其强大的光线追踪和DLSS技术领先于市场。例如,NVIDIA的RTX 3080在4K分辨率下提供了卓越的游戏体验,而AMD的Radeon RX 6800 XT虽然在某些游戏中表现接近,但在
    的头像 发表于 10-27 11:15 652次阅读

    光线追踪的工作原理

    本文翻译自Scratchapixel3.0[1],是一个关于计算机图形学的系统性的学习教程。如果有误,欢迎在评论区讨论。注:本课程更多地是关于3D渲染的一般介绍。如果您有兴趣了解射线跟踪技术,请查看
    的头像 发表于 09-30 08:05 212次阅读
    <b class='flag-5'>光线</b>追踪的工作原理

    罗克韦尔自动化FactoryTalk Optix可视化平台概述

    罗克韦尔自动化FactoryTalk Optix可视化平台概述
    的头像 发表于 09-05 15:19 584次阅读

    NVIDIA 究竟做了什么?《The First Descendant》帧率跃升 44%

    ABSTRACT摘要NVIDIA为甫上市的免费第三人称合作RPG射击游戏《第一继承者》(TheFirstDescendant)提供支援具备光线重建的NVIDIADLSS3.5、光线追踪
    的头像 发表于 07-05 08:26 638次阅读
    <b class='flag-5'>NVIDIA</b> 究竟做了什么?《The First Descendant》帧率跃升 44%

    CPU渲染和GPU渲染优劣分析

    使用计算机进行渲染时,有两种流行的系统:基于中央处理单元(CPU)或基于图形处理单元(GPU)。CPU渲染利用计算机的CPU来执行场景并将其渲染到接近完美。这也是执行渲染的更传统方式。
    的头像 发表于 05-23 08:27 591次阅读
    CPU<b class='flag-5'>渲染</b>和GPU<b class='flag-5'>渲染</b>优劣分析

    NVIDIA Omniverse USD Composer能用来做什么?如何获取呢?

    NVIDIA Omniverse™ USD Composer(以前称为 Create)是 NVIDIA Omniverse™ 中用于构建虚拟世界的参考应用程序,允许用户进行组装、模拟和渲染大型场景。
    的头像 发表于 05-20 10:07 815次阅读
    <b class='flag-5'>NVIDIA</b> Omniverse USD Composer能用来做什么?如何获取呢?

    解码AI驱动的DLSS 3.5光线重建功能

    神经网络渲染器提高了光线追踪图像质量,使用可在采样光线之间生成更高质量像素的 AI 网络取代需要人工设计的降噪器。
    的头像 发表于 05-11 11:06 517次阅读
    解码AI驱动的DLSS 3.5<b class='flag-5'>光线</b>重建功能

    HarmonyOS实战开发-合理选择条件渲染和显隐控制

    减少渲染时间,加快启动速度。 如果组件不会较频繁地在显示和隐藏间切换,或者大部分时间不需要显示,建议使用条件渲染替代显隐控制,以减少界面复杂度、减少嵌套层次,提升性能。 如果被控制的组件所占内存庞大
    发表于 05-10 15:16

    OPTIX极溯光学再获Pre-A轮融资

    近日,XR光学技术领域的佼佼者OPTIX极溯光学再度获得资本市场的青睐,成功完成了Pre-A轮融资。本轮融资由春华创投领投,而公司原有的重要股东蓝驰创投也持续为其加码。这是OPTIX极溯光学自成立不到两年以来,获得的第三笔融资。
    的头像 发表于 05-10 09:51 475次阅读

    NVIDIA推出两款基于NVIDIA Ampere架构的全新台式机GPU

    两款 NVIDIA Ampere 架构 GPU 为工作站带来实时光线追踪功能和生成式 AI 工具支持。
    的头像 发表于 04-26 11:25 621次阅读

    探索渲染技术与云渲染的魅力!

    在数字艺术和计算机图形领域中,渲染技术占据着至关重要的地位。随着科技的进步,云渲染作为一种新兴的渲染方式,正逐渐受到业界的关注和应用。本文将对渲染技术和云
    的头像 发表于 04-12 08:30 285次阅读
    探索<b class='flag-5'>渲染</b>技术与云<b class='flag-5'>渲染</b>的魅力!

    OpenHarmony Sheet 表格渲染引擎

    基于 Canvas 实现的高性能 Excel 表格引擎组件 [OpenHarmonySheet]。 由于大部分前端项目渲染层是使用框架根据排版模型树结构逐层渲染的,整棵渲染树也是与排版模型树一一对应
    发表于 01-05 16:32

    揭秘:实时渲染、离线渲染、云渲染和混合渲染的区别

    渲染,就是将3D模型转换成2D图像,并最终呈现在屏幕上的过程。常见的渲染类型有以下几种:实时渲染离线渲染渲染混合
    的头像 发表于 12-26 08:27 811次阅读
    揭秘:实时<b class='flag-5'>渲染</b>、离线<b class='flag-5'>渲染</b>、云<b class='flag-5'>渲染</b>和混合<b class='flag-5'>渲染</b>的区别