0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA Ada架构上的视频性能提升和更高保真度

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-10-12 09:11 次阅读

2022 年 GTC 发布的下一代 NVIDIA GPU ,即 NVIDIA -GeForce RTX 40 系列、 NVIDIA RTX 6000 Ada generation 和数据中心的 NVIDIA L40 ,均采用新的 NVIDIA Ada 架构构建。

NVIDIA Ada 架构具有第三代光线跟踪核心、第四代 Tensor 核心、多视频编码器和新的 Optical Flow 加速器。

为了让您能够充分利用新的硬件升级, NVIDIA 宣布了视频编解码器 SDK 和 Optical FlowSDK 的随附更新。

NVIDIA 视频编解码器 SDK 12.0

AV1 是最先进的视频编码格式,与流行标准 H.264 相比,它提供了显著的性能提升和更高的保真度。在 NVIDIA 安培体系结构上引入的视频编解码器 SDK 扩展了对 AV1 解码的支持。现在,有了视频编解码器 SDK 12.0 , NVIDIA Ada 代 GPU 支持 AV1 编码。

poYBAGNGFECAXHBrAABIgDoXaMo000.png

图 1.AV1 和 H.264 的 PSNR 与比特率的比较

硬件加速 AV1 编码是 AV1 向新标准视频格式过渡的一个巨大里程碑。图 1 显示了 AV1 比特率节省如何转化为令人印象深刻的性能提升和更高保真度的图像。

峰值信噪比( PSNR )是一种视频质量度量。为了达到 42 dB PSNR , AV1 视频的比特率为 7 Mbps ,而 H.264 的比特率高于 12 Mbps 。在所有分辨率中, AV1 编码的平均效率比 H.264 高 40% 。这一基本性能差异为 AV1 打开了支持更高质量视频、更高吞吐量和高动态范围( HDR )的大门。

pYYBAGNGFECAeZnBAAAYsjXLm8Q876.png

图 2.与 H.264 相比, AV1 的比特率节省

如图 2 所示,在 1440p 和 2160p 时, NVENC AV1 的效率是 NVENC H.264 的 1.45 倍。这种新的性能余量使图像质量比以往任何时候都高,包括 8k 。

AV1 的优点最好与 NVIDIA Ada 架构上的多编码器设计结合使用。视频编解码器 SDK 12.0 在具有多个 NVENC 的芯片上是新的,处理负载同时均匀分布在每个编码器上。这种优化大大减少了编码时间。多个编码器与 AV1 格式相结合,使 NVIDIA Ada 能够实时支持难以置信的 8k 、 60 fps 视频编码。

FRUC 库内部

下面简要说明 FRUC 库如何处理一对帧并生成插值帧。

一对连续的帧(前一帧和后一帧)被输入 FRUC 库。

使用 NVIDIA Optical Flow API ,生成正向和反向流矢量图。

然后,使用前后一致性检查验证图中的流向量。未通过一致性检查的流向量将被拒绝。此图中的黑色部分是未通过前后一致性检查的流向量。

pYYBAGNGFFWANuPwAAEmMv85Ofo119.png

图 6.验证和拒绝的流向量

使用可用的流矢量和先进的 CUDA 加速技术,生成更精确的流矢量以填充被拒绝的流矢量。图 7 显示了生成的填充流矢量图。

poYBAGNGFFeAKUXHAAEKFVQCc38011.png

图 7.填充流矢量图

pYYBAGNGFFiAKUDOAACHNHUdoes616.jpg

图 8.带有灰色区域的新插值帧

使用两个帧之间的完整流向量映射,该算法在两个输入帧之间生成插值帧。这样的图像可能包含几个孔(没有有效颜色的像素)。 这张图显示了马头附近和天空中的一些小灰色区域,这些区域是洞。

使用图像域孔填充技术填充插值帧中的孔,以生成最终插值图像。这是 FRUC 库的输出。

调用应用程序可以将此插值帧与原始帧交错,以提高视频或游戏的帧速率。

最后,为了扩展可以利用 NVOFA 硬件的平台, Optical Flow SDK 4.0 还引入了对 Windows Subsystem for Linux 的支持。

跨多硬件 NVENC 的 AV1 编码实现了下一代视频性能和保真度。广播平台可以获得更高的实时流分辨率,视频编辑器可以以 2 倍的速度导出视频,所有这些都是由视频编解码器 SDK 实现的。

NVIDIA Video Codec SDK 12.0 将于 2022 年 10 月从 NVIDIA 开发中心下载

NVIDIA Optical Flow 4.0

新的 NVIDIA Optical Flow SDK 4.0 版本引入了引擎辅助帧速率提升转换( FRUC )。 FRUC 通过使用光流矢量插入插值帧,从低帧速率视频生成高帧速率的视频。这样的高帧速率视频显示了跨帧运动的平滑连续性。其结果是提高了视频播放的平滑度和感知的视觉质量。

NVIDIA Ada Lovelace 架构有一种新的 Optical Flow 加速器,即 NVOFA ,其性能比 NVIDIA-Ampere 架构 NVOFA.高 2.5 倍。它在包括 KITTI 和 MPI Sintel 在内的流行基准测试上提供了 15% 的质量改进。

FRUC 库使用 NVOFA 和 CUDA 插入帧的速度明显快于仅使用软件的方法。它还可以与自定义 DirectX 或 CUDA 应用程序无缝协作,使开发人员易于集成。

pYYBAGNGFGWABPzjAADU8xOYFow038.jpg

图 3.帧速率上转换

除了基本的光流示例应用程序外,Optical Flow SDK 4.0 还包括 FRUC 库和示例应用程序。 FRUC 库公开了 NVIDIA FRUC API ,这些 API 采用两个连续的帧,并在帧之间返回一个插值帧。这些 API 可用于任何视频的上转换。

与其他仅使用软件的方法相比,使用 FRUC 库的帧插值速度非常快。 API 易于使用,并支持 ARGB 和 NV12 输入曲面格式。它可以直接集成到任何 DirectX 或 CUDA 应用程序中。

SDK 中包含的示例应用程序源代码演示了如何将 FRUC API 用于视频 FRUC 。此源代码可以根据需要重用或修改,以构建自定义应用程序。

关于作者

Rohit Naskulwar 是 NVIDIA 多媒体驱动程序和应用程序团队的高级系统软件工程师。他曾在 NVIDIA GPU 上研究 VR 和光流用例。在加入 NVIDIA 之前,他曾在西门子从事 PLM TeamCenter 服务器端开发。 Rohit 拥有印度普纳大学计算机工程学士学位。

Aurobinda Maharana 是 NVIDIA 多媒体驱动团队的高级系统软件工程师。他从事 NVIDIA 光流驱动器和应用程序编程接口设计。此前,他曾负责 NVIDIA 视频驱动程序、 NVIDIA 流媒体和深度学习解决方案。他拥有印度班加罗尔印度科学院系统科学与自动化硕士学位。

Hareshkumar Borse 是 NVIDIA 多媒体驱动程序和应用程序团队的系统软件经理。他曾在 NVIDIA GPU 上研究视频、音频、 3dvision 和光流用例。在加入 NVIDIA 之前,他曾在 C-DAC 从事视频和图形应用程序开发。他拥有印度孟买 IIT 通信工程硕士学位

Robert Jensen 是 NVIDIA 的产品营销实习生,也是康涅狄格大学的计算机科学专业。他目前正致力于使开发人员能够采用 NVIDIA 光线追踪和 AI 软件。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    3638

    浏览量

    134426
  • NVIDIA
    +关注

    关注

    14

    文章

    4978

    浏览量

    102987
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4729

    浏览量

    128890
收藏 人收藏

    评论

    相关推荐

    高保真是什么意思?什么叫高保真

    `<p><b><font face="Verdana">高保真
    发表于 05-04 18:58

    影响数字示波器的信号保真度的几个因素

    89601等,这成为数字示波器的另一发展趋势。而衡量数字示波器的指标很多,不免让人分不清主次,实际最主要的但却较抽象的衡量标准是信号保真度(Signal Fidelity),信号保真度简单说就是示波器
    发表于 06-05 06:42

    A/D转换器保真度敏感测试

    A/D 转换器的保真度测试
    发表于 09-05 08:33

    是德科技关于保真度的真相高带宽电压探头

    通过分析高带宽电压探头,揭示了存在于所有高带宽探头的保真度与易用性的基本权衡。
    发表于 11-06 07:49

    什么是高保真耳机

    什么叫高保真耳机 常听说“高保真耳机”、“高保真音响”。音响中的“高保真”指的是什么高保真简单的说就是 让你感受原汁原味的声音 好象就在
    发表于 10-09 16:18 53次下载

    什么是高保真

    什么是高保真高保真的英文原词是High Fidelity,简称HI-FI。高保真指声频录音及放音系统或设备具有如实反
    发表于 05-04 18:55 1.2w次阅读

    高保真BTL放大器的原理及设计

    高保真BTL放大器的原理及设计  本文介绍一种无需调试、保真度高、成本低廉的BTL功率放大电路,并且可以根据自己的情况选取末级功放集成电路
    发表于 12-25 09:41 1939次阅读
    <b class='flag-5'>高保真</b>BTL放大器的原理及设计

    卓锐微技术推出兼容JFET的高保真度ECM放大器ACT503

    卓锐微技术推出兼容JFET的高保真度ECM放大器ACT503 日前,卓锐微技术(Acuti Microsystems)宣布推出专门用于小型低成本ECM麦克风方案的高保真放大器芯片。这款型号为ACT503的E
    发表于 02-02 08:35 1409次阅读

    数字示波器的信号保真度探析

    现在衡量数字示波器的指标很多,不免让人分不清主次,实际最主要的但却抽象的衡量标准是信号保真度,简单说信号保真度就是示波器显示的波形和被测波形的一致性。因为波形从
    发表于 05-13 18:56 42次下载
    数字示波器的信号<b class='flag-5'>保真度</b>探析

    高保真音响原理介绍

    评价一台高保真音响设备的保真度,虽然规定了许多量化了的技术指标,如频响、失真、瞬态响应和信噪比等,其实它们仅仅是为了检验设备的保真度所应达到的可测量指标。通过检验这些指标,间接地了解
    发表于 02-12 11:27 5615次阅读

    高保真度音频功率放大器LMV1024/6的性能特点及应用范围

    National半导体公司推出的两种音频放大器LMV1024和LMV1026,能在驻极体电容麦克风(ECM)直接产生高保真度的声音质量。
    发表于 01-04 09:01 1530次阅读
    <b class='flag-5'>高保真度</b>音频功率放大器LMV1024/6的<b class='flag-5'>性能</b>特点及应用范围

    A/D 转换器的保真度测试

    A/D 转换器的保真度测试
    发表于 03-21 13:04 0次下载
    A/D 转换器的<b class='flag-5'>保真度</b>测试

    实现大规模量子计算的品质保证——高保真度

    在量子计算中,量子门的保真度是评估量子计算机性能的重要指标之一,也是实现大规模量子计算的基础。那么,什么是保真度?哪种量子计算机的保真度最好?保真度
    的头像 发表于 11-22 08:24 1342次阅读
    实现大规模量子计算的品质保证——<b class='flag-5'>高保真度</b>

    示波器响应方式对信号采集保真度的影响

    信号保真度是评价数字示波器性能最主要的衡量标准,而采用合适的输入脉冲响应方 式则是示波器高保真还原信号真实面目的非常重要的环节。信号保真度定义为显示在示波器 屏幕
    的头像 发表于 12-04 14:34 503次阅读
    示波器响应方式对信号采集<b class='flag-5'>保真度</b>的影响

    性能高保真度PowerDriver集成全数字音频放大器NTP8835数据手册

    电子发烧友网站提供《高性能高保真度PowerDriver集成全数字音频放大器NTP8835数据手册.pdf》资料免费下载
    发表于 01-26 15:53 6次下载