0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何使用Maxine和编解码解决边缘计算难题

星星科技指导员 来源:NVIDIA 作者:About Mana Murakami, 2022-03-31 16:25 次阅读

SoftBank 是一家致力于推动信息革命的全球技术公司。该公司经营宽带、固定线路电信、电子商务、信息技术、金融、媒体和营销。为了改善用户的通信体验,并克服 5G 容量和覆盖问题,软银使用了 NVIDIA Maxine GPU- 具有最先进人工智能功能的加速 SDK 来构建虚拟协作和内容创建应用程序。

在本文中,您将了解软银如何使用 Maxine 超分辨率和硬件加速的编解码操作来减少必须上传到多址边缘计算( MEC )服务器的数据量。除了解决有限带宽的挑战外, Maxine 功能(如噪音消除和虚拟背景)使软银能够为用户提供最佳的视频会议解决方案。

使用 MEC 的好处

边缘计算使提供商能够将其技术部署到更接近用户的位置。简单地说,边缘计算减少了关键任务、高吞吐量、低延迟应用程序的带宽和延迟预算。这是通过使用 MEC 网络技术将计算从远程云服务器移动到更靠近消费源的节点来实现的。边缘计算在很大程度上依赖于网络技术,如 4G ,以及最近的 5G ,以提供连接性。

Diagram demonstrating the regular pipeline in a MEC 5G infrastructure. Edge devices like mobile phones are severed by 5G transmission infrastructure, which is connected to the MEC server. The MEC server is where you deploy Maxine SDKs. Finally, the MEC server is connected to the central cloud.

图 1 。涉及 MEC 服务器的管道的简化概述

5G 功能(如超高速、超低延迟和多个同时连接)支持新的使用案例,如远程医疗和智能工厂,这些都是以前无法通过无线连接实现的。 MEC 是实现低延迟、高吞吐量用例支持的关键。 MEC 通过部署区域 MEC 服务器并仅向云发送最低限度的必要数据,在边缘尽可能多地进行处理,从而减少响应延迟。 MEC 服务器通常使用 GPU 大规模并行计算能力以高速处理大量数据。

5G 网络的挑战

当前的 5G 网络以一种称为非独立( NSA )的配置运行。此配置结合了 4G LTE 网络和 5G 基站,其中某些 5G 功能(如网络切片)不可用。 5G SA (独立)配置具有 5G 核心和基站。 5G SA 对 5G 的端到端支持加快了服务速度,降低了成本,提高了服务质量,是部署服务的更好平台。

当 5G SA 配置上市时,完整的 5G 网络就完成了。换言之, 5G 分两步发展: 5G NSA 和 5G SA 。每一步都需要资本投资。

另一方面,包括软银在内的一些电信运营商已经开始在 4G LTE 和 5G NR 中使用 4G LTE 低频段频率。理论上,容量和覆盖率是无线通信中的权衡。为了确保 5G SA 配置的高质量广域覆盖,软银使用 MEC 尽可能有效地减少服务延迟。

A graph showcasing the capacity vs. coverage tradeoff for 5G frequencies. The High-band frequency band has the highest capacity and the lowest coverage and the low band frequency band has the highest coverage but low capacity.

图 2 。 5G 频率中容量和覆盖率之间的权衡

此外,还有一些技术挑战。移动网络通常被设计为适应比上行链路更高的下行链路速度。这种设计理念适用于一般应用,如智能手机上的流媒体视频,因为大部分流量是下行链路。然而,一些关键应用需要强大的上行链路连接。其中之一是视频会议,用户需要相当大的上行带宽来传输高分辨率视频和音频

当前 5G 上行链路容量不足,需要载波聚合和 MIMO 天线来提供更多的上行链路分配。随着越来越多的设备连接到 5G ,节省带宽,特别是在上行链路中,是所有全球电信运营商面临的共同挑战。

上行链路带宽密集型应用,例如视频会议,可以在减少的上行链路带宽(例如, 500 Kbps )下以与充足带宽( 100 Mbps )相同的服务质量来服务。在这些情况下,可以连接更多的设备,同时提供高质量的服务。

基于 NVIDIA Maxine 的 MEC 视频会议解决方案

NVIDIA Maxine 是一个 GPU 加速 SDK 平台,它使视频会议服务的开发人员能够构建和部署使用云中最先进模型的人工智能功能。 Maxine 包括使用 NVIDIA 研究的最新创新的 API ,如伪影减少、身体姿势估计、超分辨率和噪声消除。 Maxine 还使用其他产品,如 NVIDIA Riva,来提供封闭字幕和访问虚拟助理等功能。这些功能在 NVIDIA GPU 上得到充分加速,以便在云中运行实时视频流应用程序。

Maxine 应用程序使服务提供商能够在任何设备(包括计算机、平板电脑手机)上为每个用户提供相同的功能。关键的一点是,所有的处理都是在云上进行的,因此在任何设备上运行的应用程序都需要最少的资源。使用 Maxine 构建的应用程序可以轻松部署为微服务,并在 Kubernetes 环境中扩展到数十万个流。

其想法是减轻视频会议系统中涉及的计算密集型处理,减少必须上传到 MEC 服务器的数据量。这是通过超分辨率和硬件加速编解码操作等视频效果的组合来实现的。 Maxine 还增加了生活质量功能,如噪音消除、虚拟背景、房间回声消除等。

这对最终用户意味着什么?基本上,具有低带宽连接的终端用户在现场工作时会受到各种背景噪音的干扰,因此可以连接到干净的音频和高清晰度视频。例如,一个工厂经理在一个嘈杂的生产车间,在一个有 180p 流连接的偏远地点,似乎在一个有 720p 流的安静会议室里。计算资源的卸载也意味着终端用户可以在资源有限的设备(如手机和笔记本电脑)上执行多任务,从而延长电池寿命和更多可用内存。

前面提到的功能包含在以下SDKs中:

视频效果 SDK

音频效果 SDK

增强现实 SDK

此外, NVIDIA 视频编解码器 SDK 提供硬件加速编码和解码,以帮助视频会议周围的基础设施。

软银如何使用 NVIDIA Maxine

通常,如果要在移动电话上使用视频会议解决方案,必须首先安装客户端应用程序。就软银而言, Zoom 客户端安装在运营商网络上的 MEC 服务器上,而不是移动电话上。移动电话的视频和麦克风输出通过 5G 网络输入到 MEC 上的 Zoom 客户端。 MEC 将智能手机的麦克风和摄像头识别为虚拟麦克风和摄像头,并将其用作 Zoom 客户端的输入。

An architecture diagram for Softbank’s proof-of-concept implementation showing the interplay between the client, MEC server, and Zoom server

图 5 。软银和 Maxine POC :概览图

以下是用于软银概念验证实施的硬件和软件规范:

Hardware

GPU :Quadro RTX6000(驱动程序版本: 456 。 43 )

CPU英特尔至强黄金 6244

Software

Windows 服务器 2019

WebRTC 本机客户端 Momo

CUDA11 。 1

NVIDIA Maxine 视频效果 SDK( 2021 年 3 月 25 日 -VFX 预发布)

NVIDIA Maxine 音频效果 SDK EA

这项工作使用了软银的 MEC 服务器( Windows )、一个改进的基于 C ++的开源 WebRTC 客户端“ WebRTC 客户端 Momo ”,以及一个使用视频效果 SDK 和音频效果 SDK API 的应用程序。

AudioEffectSDK 中的NvAFX_RUN API (NVAFX_EFFECT_DENOISER)和视频效果 SDK 中的NvVFX_RUN API (NVVFX_FX_SUPER_RES)用于执行视频超分辨率和噪声消除。

Code examples to highlight important Video Effects SDK API calls. It shows the API calls needed to initialize and run the effect.

图 6 。视频效果 SDK API 的示例代码

Code examples to highlight important Audio Effects SDK API calls. It shows the API calls needed to initialize and run the effect

图 7 。 Audio Effects SDK API 的示例代码

使用 WebRTC 协议从 5G 用户设备发送的视频流以低比特率(在此验证中, H 。 264 ( CBR ) 180p )上传到 MEC ,以节省上行链路带宽。 MEC 以低比特率接收降级的音频和视频,并使用 Maxine SDK 提高质量。对于视频, MEC 服务器使用 Maxine SuperResolution功能将从用户设备以 180p 发送的视频调整为 720p 。SuperResolution降低噪音并恢复高频分量,从而产生高质量的视频。

图 8 显示了SuperResolution的结果。

An image showcasing the Super Resolution effect from the Video Effects SDK (from SoftBank). The left half shows a 360p “before” and the right half showcases the 720p output

图 8 。原始块状图像(左半部分)与应用 Maxine AI 功能后的图像(右半部分)

在图 8 中,左侧是应用SuperResolution之前的原始数据,右侧是放大的图像。面部细节中的块状伪影被替换为更多像素,从而生成高质量图像。您可以使用随 Video Effects SDK 提供的示例应用程序复制这些结果。有关完整演示,请参见a Maxine 前/ Maxine 后视频。

与超分辨率结果一样,视频中将显示噪声消除结果。

视频显示了用户在键盘上打字时说话的场景中测试 Maxine 噪音消除功能的结果。在这里,选择键盘声音作为样本,但在软银 PoC 的整个开发过程中,噪音消除在各种情况下也很有用。软银认为,噪音消除使嘈杂的环境会议成为可能,如户外或汽车会议。

您可以使用 Audio Effects SDK 提供的示例应用程序复制这些结果。

提高视频流的质量

通过在 MEC 服务器上部署 Maxine ,除了低延迟外,软银现在还为所有最终用户提供高质量的视频和音频体验。由于不需要额外的硬件或用户设备,因此通过上行链路带宽的高节省实现了改进的最终用户体验。为了进一步提高视频质量,软银计划使用 Maxine AI 人脸编解码器。

关于作者

About Mana Murakami

Mana Murakami 是 NVIDIA 的高级解决方案架构师。她专注于向日本的电信客户加速基于 AI 、 GPU 的 vRAN 和 GPU 计算。 Mana 于 2015 年加入 NVIDIA ,担任 CUDA 工程师,并担任将 GPU 计算推广到 HPC 和制造业的技术领导。在加入 NVIDIA 之前,她从事图像处理的研究和开发,如色度键控和超分辨率。

About Tanay Varshney

Tanay Varshney 是 NVIDIA 的一名深入学习的技术营销工程师,负责广泛的 DL 软件产品。他拥有纽约大学计算机科学硕士学位,专注于计算机视觉、数据可视化和城市分析的横断面。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4689

    浏览量

    102121
  • 人工智能
    +关注

    关注

    1781

    文章

    45082

    浏览量

    232470
收藏 人收藏

    评论

    相关推荐

    全志T527芯片详解:计算性能与高清图像编解码

    全志T527芯片详解:计算性能与高清图像编解码
    的头像 发表于 05-21 14:37 1188次阅读
    全志T527芯片详解:<b class='flag-5'>计算</b>性能与高清图像<b class='flag-5'>编解码</b>

    边缘计算网关与边缘计算的融合之道

    随着物联网、大数据和人工智能的飞速发展,数据处理和分析的需求呈现出爆炸式增长。传统的中心化数据处理模式已难以满足实时性、低延迟和高带宽的需求,边缘计算应运而生,成为解决这一难题的关键技术。而
    的头像 发表于 02-26 16:29 240次阅读
    <b class='flag-5'>边缘</b><b class='flag-5'>计算</b>网关与<b class='flag-5'>边缘</b><b class='flag-5'>计算</b>的融合之道

    编解码一体机的主要应用场景是什么?

    编解码一体机是一种集视频编解码、音频编码以及数据传输功能于一体的多媒体设备,广泛应用于各个领域。以下是编解码一体机的几个主要应用场景: 来百度APP畅享高清图片 视频会议:编解码一体机
    的头像 发表于 01-31 14:57 309次阅读
    <b class='flag-5'>编解码</b>一体机的主要应用场景是什么?

    编解码一体机相对于传统的编解码设备有哪些优势?

    编解码一体机相对于传统的编解码设备具有多个优势。以下是编解码一体机的几个主要优势: 高效实时的视频处理能力:编解码一体机采用先进的编解码算法
    的头像 发表于 01-31 14:56 713次阅读
    <b class='flag-5'>编解码</b>一体机相对于传统的<b class='flag-5'>编解码</b>设备有哪些优势?

    深入了解编解码一体机:工作原理及应用

    编解码一体机是一种集视频编解码、音频编码以及数据传输功能于一体的多媒体设备。它的工作原理主要涉及以下几个步骤: 视频采集:编解码一体机通过输入接口,将原始视频信号采集到设备中。这些信号可能来自摄像机
    的头像 发表于 01-31 14:52 261次阅读
    深入了解<b class='flag-5'>编解码</b>一体机:工作原理及应用

    如何选择最适合你的编解码一体机?

    选择最适合自己的编解码一体机需要考虑以下几个方面: 应用场景:首先需要明确编解码一体机的应用场景,如视频会议、安防监控、教育录播等。不同的应用场景对编解码一体机的性能要求不同,需要根据具体需求
    的头像 发表于 01-31 14:49 343次阅读
    如何选择最适合你的<b class='flag-5'>编解码</b>一体机?

    编解码一体机:技术、应用与挑战

    编解码一体机是一种集视频编解码、音频编码以及数据传输功能于一体的多媒体设备。它基于云计算技术,具有高效、实时的视频处理能力,广泛应用于安防监控、视频会议、教育录播等领域。 首先,编解码
    的头像 发表于 01-31 14:48 254次阅读
    <b class='flag-5'>编解码</b>一体机:技术、应用与挑战

    编解码一体机看视频处理技术的未来

    编解码一体机的发展趋势来看,视频处理技术未来将朝着以下几个方向发展: 高效编解码技术:随着视频分辨率和码率的不断提高,对编解码效率的要求也越来越高。未来,编解码一体机将采用更先进的
    的头像 发表于 01-31 14:47 225次阅读
    从<b class='flag-5'>编解码</b>一体机看视频处理技术的未来

    音频处理的新选择:编解码一体机

    编解码一体机作为音频处理的新选择,以其高效、灵活的解决方案,引领着音频处理技术的新篇章。这种设备集成了音频编解码和数据传输功能,将复杂的音频处理流程简化在一台设备中,提高了音频处理的效率和灵活性
    的头像 发表于 01-31 14:46 303次阅读
    音频处理的新选择:<b class='flag-5'>编解码</b>一体机

    什么是编解码一体机?

    编解码一体机是一种集视频编解码、音频编码以及数据传输功能于一体的多媒体设备。这种设备通常基于云计算技术和先进的编解码算法,能够高效地处理视频流,提供低延迟、高稳定性的音视频传输服务。此
    的头像 发表于 01-31 14:19 344次阅读
    什么是<b class='flag-5'>编解码</b>一体机?

    什么是边缘计算边缘计算有哪些应用?

    什么是边缘计算边缘计算有哪些应用? 边缘计算是一种将计算
    的头像 发表于 01-09 11:29 1022次阅读

    视频编解码器-晶振应用选型方案简介

    随着科技的日新月异,视频编解码技术也将迎来新的发展机遇,5G网络的普及将进一步提升视频传输速度和质量,为视频编解码器的发展提供更广阔的空间。
    的头像 发表于 12-09 10:55 610次阅读
    视频<b class='flag-5'>编解码</b>器-晶振应用选型方案简介

    如何进行编解码性能测试?是否有参考程序?

    如何进行编解码性能测试?是否有参考程序?
    发表于 09-19 06:56

    XC3588边缘计算工控机产品介绍

    ,专用2D 图形加速模块;6TOPS AI 算力,三核架构,8K 视频编解码 , 8K 显示输出,广泛应用边缘计算,云游戏,虚拟桌面,多路视频编解码,云存储等领域。
    发表于 09-14 15:25 0次下载

    openharmony怎么调用GPU进行视频和图片的编解码

    openharmony怎么调用芯片里的GPU进行视频和图片的编解码? 每个不同的芯片需要单独调整适配吗?
    发表于 08-14 15:10