0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用NVIDIA Maxine的MEC视频会议解决方案

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-20 16:44 次阅读

SoftBank 是一家致力于推动信息革命的全球技术公司。该公司经营宽带、固定线路电信、电子商务、信息技术、金融、媒体和营销。为了改善用户的通信体验,并克服 5G 容量和覆盖问题,软银使用了 NVIDIA Maxine GPU- 具有最先进人工智能功能的加速 SDK 来构建虚拟协作和内容创建应用程序。

在本文中,您将了解软银如何使用 Maxine 超分辨率和硬件加速的编解码操作来减少必须上传到多址边缘计算( MEC )服务器的数据量。除了解决有限带宽的挑战外, Maxine 功能(如噪音消除和虚拟背景)使软银能够为用户提供最佳的视频会议解决方案。

使用 MEC 的好处

边缘计算使提供商能够将其技术部署到更接近用户的位置。简单地说,边缘计算减少了关键任务、高吞吐量、低延迟应用程序的带宽和延迟预算。这是通过使用 MEC 网络技术将计算从远程云服务器移动到更靠近消费源的节点来实现的。边缘计算在很大程度上依赖于网络技术,如 4G ,以及最近的 5G ,以提供连接性。

poYBAGJfx9SAOldaAACOjfDXMmg207.png

图 1 涉及 MEC 服务器的管道的简化概述

5G 功能(如超高速、超低延迟和多个同时连接)支持新的使用案例,如远程医疗和智能工厂,这些都是以前无法通过无线连接实现的。 MEC 是实现低延迟、高吞吐量用例支持的关键。 MEC 通过部署区域 MEC 服务器并仅向云发送最低限度的必要数据,在边缘尽可能多地进行处理,从而减少响应延迟。 MEC 服务器通常使用 GPU 大规模并行计算能力以高速处理大量数据。

5G 网络的挑战

当前的 5G 网络以一种称为非独立( NSA )的配置运行。此配置结合了 4G LTE 网络和 5G 基站,其中某些 5G 功能(如网络切片)不可用。 5G SA (独立)配置具有 5G 核心和基站。 5G SA 对 5G 的端到端支持加快了服务速度,降低了成本,提高了服务质量,是部署服务的更好平台。

当 5G SA 配置上市时,完整的 5G 网络就完成了。换言之, 5G 分两步发展: 5G NSA 和 5G SA 。每一步都需要资本投资。

另一方面,包括软银在内的一些电信运营商已经开始在 4G LTE 和 5G NR 中使用 4G LTE 低频段频率。理论上,容量和覆盖率是无线通信中的权衡。为了确保 5G SA 配置的高质量广域覆盖,软银使用 MEC 尽可能有效地减少服务延迟。

pYYBAGJfx9WATXIQAAA_RumBmig968.png

图 2 5G 频率中容量和覆盖率之间的权衡

此外,还有一些技术挑战。移动网络通常被设计为适应比上行链路更高的下行链路速度。这种设计理念适用于一般应用,如智能手机上的流媒体视频,因为大部分流量是下行链路。然而,一些关键应用需要强大的上行链路连接。其中之一是视频会议,用户需要相当大的上行带宽来传输高分辨率视频和音频

当前 5G 上行链路容量不足,需要载波聚合和 MIMO 天线来提供更多的上行链路分配。随着越来越多的设备连接到 5G ,节省带宽,特别是在上行链路中,是所有全球电信运营商面临的共同挑战。

上行链路带宽密集型应用,例如视频会议,可以在减少的上行链路带宽(例如, 500 Kbps )下以与充足带宽( 100 Mbps )相同的服务质量来服务。在这些情况下,可以连接更多的设备,同时提供高质量的服务。

基于 NVIDIA Maxine 的 MEC视频会议解决方案

NVIDIA Maxine 是一个 GPU 加速 SDK 平台,它使视频会议服务的开发人员能够构建和部署使用云中最先进模型的人工智能功能。 Maxine 包括使用 NVIDIA 研究的最新创新的 API ,如伪影减少、身体姿势估计、超分辨率和噪声消除。 Maxine 还使用其他产品,如 NVIDIA Riva,来提供封闭字幕和访问虚拟助理等功能。这些功能在 NVIDIA GPU 上得到充分加速,以便在云中运行实时视频流应用程序。

Maxine 应用程序使服务提供商能够在任何设备(包括计算机、平板电脑手机)上为每个用户提供相同的功能。关键的一点是,所有的处理都是在云上进行的,因此在任何设备上运行的应用程序都需要最少的资源。使用 Maxine 构建的应用程序可以轻松部署为微服务,并在 Kubernetes 环境中扩展到数十万个流。

其想法是减轻视频会议系统中涉及的计算密集型处理,减少必须上传到 MEC 服务器的数据量。这是通过超分辨率和硬件加速编解码操作等视频效果的组合来实现的。 Maxine 还增加了生活质量功能,如噪音消除、虚拟背景、房间回声消除等。

这对最终用户意味着什么?基本上,具有低带宽连接的终端用户在现场工作时会受到各种背景噪音的干扰,因此可以连接到干净的音频和高清晰度视频。例如,一个工厂经理在一个嘈杂的生产车间,在一个有 180p 流连接的偏远地点,似乎在一个有 720p 流的安静会议室里。计算资源的卸载也意味着终端用户可以在资源有限的设备(如手机和笔记本电脑)上执行多任务,从而延长电池寿命和更多可用内存。

前面提到的功能包含在以下SDKs中:

视频效果 SDK

音频效果 SDK

增强现实 SDK

此外, NVIDIA 视频编解码器 SDK 提供硬件加速编码和解码,以帮助视频会议周围的基础设施。

poYBAGJfx9aAIYGgAAJwhdH90Q8173.png

图 4 Maxine AI 人脸编解码器概述

软银如何使用 NVIDIA Maxine

通常,如果要在移动电话上使用视频会议解决方案,必须首先安装客户端应用程序。就软银而言, Zoom 客户端安装在运营商网络上的 MEC 服务器上,而不是移动电话上。移动电话的视频和麦克风输出通过 5G 网络输入到 MEC 上的 Zoom 客户端。 MEC 将智能手机的麦克风和摄像头识别为虚拟麦克风和摄像头,并将其用作 Zoom 客户端的输入。

pYYBAGJfx9eAVvOGAACL0_bYNIA425.png

图 5 软银和 Maxine POC :概览图

以下是用于软银概念验证实施的硬件和软件规范:

Hardware

GPU :Quadro RTX6000(驱动程序版本: 456 。 43 )

CPU英特尔至强黄金 6244

Software

Windows 服务器 2019

WebRTC 本机客户端 Momo

CUDA11 。 1

NVIDIA Maxine 视频效果 SDK( 2021 年 3 月 25 日 -VFX 预发布)

NVIDIA Maxine 音频效果 SDK EA

这项工作使用了软银的 MEC 服务器( Windows )、一个改进的基于 C ++的开源 WebRTC 客户端“ WebRTC 客户端 Momo ”,以及一个使用视频效果 SDK 和音频效果 SDK API 的应用程序。

AudioEffectSDK 中的NvAFX_RUN API (NVAFX_EFFECT_DENOISER)和视频效果 SDK 中的NvVFX_RUN API (NVVFX_FX_SUPER_RES)用于执行视频超分辨率和噪声消除。

poYBAGJfx9iAJqJmAAFcO1rHrdY642.png

图 6 视频效果 SDK API 的示例代码

pYYBAGJfx9mAThSAAAD0GY5BMqw084.png

图 7 Audio Effects SDK API 的示例代码

使用 WebRTC 协议从 5G 用户设备发送的视频流以低比特率(在此验证中, H 。 264 ( CBR ) 180p )上传到 MEC ,以节省上行链路带宽。 MEC 以低比特率接收降级的音频和视频,并使用 Maxine SDK 提高质量。对于视频, MEC 服务器使用 Maxine SuperResolution功能将从用户设备以 180p 发送的视频调整为 720p 。SuperResolution降低噪音并恢复高频分量,从而产生高质量的视频。

图 8 显示了SuperResolution的结果。

pYYBAGJfx96AN6SdAAOs2lwJNb0534.png

图 8 原始块状图像(左半部分)与应用 Maxine AI 功能后的图像(右半部分)

在图 8 中,左侧是应用SuperResolution之前的原始数据,右侧是放大的图像。面部细节中的块状伪影被替换为更多像素,从而生成高质量图像。您可以使用随 Video Effects SDK 提供的示例应用程序复制这些结果。有关完整演示,请参见a Maxine 前/ Maxine 后视频。

与超分辨率结果一样,视频中将显示噪声消除结果。

视频显示了用户在键盘上打字时说话的场景中测试 Maxine 噪音消除功能的结果。在这里,选择键盘声音作为样本,但在软银 PoC 的整个开发过程中,噪音消除在各种情况下也很有用。软银认为,噪音消除使嘈杂的环境会议成为可能,如户外或汽车会议。

您可以使用 Audio Effects SDK 提供的示例应用程序复制这些结果。

提高视频流的质量

通过在 MEC 服务器上部署 Maxine ,除了低延迟外,软银现在还为所有最终用户提供高质量的视频和音频体验。由于不需要额外的硬件或用户设备,因此通过上行链路带宽的高节省实现了改进的最终用户体验。为了进一步提高视频质量,软银计划使用 Maxine AI 人脸编解码器。

关于作者

Mana Murakami 是 NVIDIA 的高级解决方案架构师。她专注于向日本的电信客户加速基于 AI 、 GPU 的 vRAN 和 GPU 计算。 Mana 于 2015 年加入 NVIDIA ,担任 CUDA 工程师,并担任将 GPU 计算推广到 HPC 和制造业的技术领导。在加入 NVIDIA 之前,她从事图像处理的研究和开发,如色度键控和超分辨率。

Tanay Varshney 是 NVIDIA 的一名深入学习的技术营销工程师,负责广泛的 DL 软件产品。他拥有纽约大学计算机科学硕士学位,专注于计算机视觉、数据可视化和城市分析的横断面。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1129

    浏览量

    40620
  • NVIDIA
    +关注

    关注

    14

    文章

    4843

    浏览量

    102694
  • 计算机
    +关注

    关注

    19

    文章

    7337

    浏览量

    87614
收藏 人收藏

    评论

    相关推荐

    凯茉锐电子 索尼FCB-EV9520L摄像机在视频会议中的卓越表现

    随着信息技术的不断进步,视频会议已经成为现代企业和组织日常沟通的重要桥梁。在众多视频会议设备中,索尼FCB-EV9520L摄像机凭借其出色的性能和高度的适用性,赢得了广泛的关注和赞誉。
    的头像 发表于 10-30 10:46 107次阅读

    破壁新章 | 基于NDI技术的IP会议解决方案

    大屏会议、互联网直播等实际应用场景,需要更先进的音视频解决方案。为了应对这些问题和挑战,我们推出了基于NDI(网络设备接口)技术的IP会议解决方案
    的头像 发表于 08-30 12:07 344次阅读
    破壁新章 | 基于NDI技术的IP<b class='flag-5'>会议</b><b class='flag-5'>解决方案</b>

    凯茉锐电子 索尼FCB-EV7520术野摄像机在视频会议领域的应用

    在日益数字化和远程化的工作环境中,视频会议已成为企业沟通协作的重要工具。索尼FCB-EV7520术野摄像机,凭借其卓越的技术特性和强大的功能,在视频会议领域展现出了广泛的应用价值。这款摄像机搭载了
    的头像 发表于 08-23 09:44 213次阅读

    揭秘生成式人工智能如何重塑视频会议体验

    据Hailo首席技术官Avi Baum先生介绍,人工智能将大大提升视频会议的互动性和沉浸感,为集成商和系统设计师们带来全新的机遇。 尽管虚拟会议已经广泛普及并成为主流方式,但现有技术尚无法全面复刻
    的头像 发表于 08-19 14:54 144次阅读

    FCB-EV9520L低延时模式下,在视频会议领域的创新-轩展科技

    FCB-EV9520L高清摄像机芯模组的低延时模式可以确保视频会议的流畅进行,提高参会者之间的实时交流效果。
    的头像 发表于 07-19 17:11 357次阅读
    FCB-EV9520L低延时模式下,在<b class='flag-5'>视频会议</b>领域的创新-轩展科技

    迅为RK3562核心板四核A53+MaliG52架构,应用于商业平板电脑,视频会议,智能家居,教育电子,医疗设备,边缘计算,工业应用

    迅为RK3562核心板四核A53+MaliG52架构,应用于商业平板电脑,视频会议,智能家居,教育电子,医疗设备,边缘计算,工业应用
    发表于 07-09 10:57

    视频会议解决方案

    飞腾云XU316 7MIC无感本地扩音方案正是可以解决视频会议中音质不好的问题的有效解决方案
    的头像 发表于 06-28 15:30 409次阅读
    <b class='flag-5'>视频会议</b><b class='flag-5'>解决方案</b>

    在线视频会议软件有哪些?三种实现方式

    视频会议技术已经广泛被应用且不断发展。从高端的硬件配置到经济的软件解决方案,市场提供了多种多样的视频会议产品。为了协助专业人士和企业在选择上做出明智决策,在线视频会议软件有哪些?按照在
    的头像 发表于 05-21 17:43 484次阅读
    在线<b class='flag-5'>视频会议</b>软件有哪些?三种实现方式

    MEC是什么-mec可以做什么

    MEC边缘计算单元已经成为物联网时代智能发展的重要支撑。具有低延迟、高响应的数据处理能力,灵活部署和应用,提供安全稳定的数据处理和存储解决方案
    的头像 发表于 04-18 11:22 6331次阅读
    <b class='flag-5'>MEC</b>是什么-<b class='flag-5'>mec</b>可以做什么

    MAXHUB首发高效会议解决方案,满足用户智能化协作需求

    为方向,为用户提供高效、便捷、智能的沟通协作体验。   MAXHUB高效会议解决方案以领效星云为数字基座,灵活搭配显示、视频会议、发言等9大子系统,打造视频会议、培训、展厅等六大标准化
    的头像 发表于 04-17 09:08 363次阅读
    MAXHUB首发高效<b class='flag-5'>会议</b><b class='flag-5'>解决方案</b>,满足用户智能化协作需求

    基于视频会议系统的指挥车工程通信解决方案

    指挥车工程在应对紧急事件、协调资源以及现场指挥等方面发挥着至关重要的作用。为了实现高效、稳定的通信,提升指挥决策效率,基于讯维视频会议系统的通信解决方案应运而生。 一、系统架构 该通信解决方案以讯维
    的头像 发表于 03-08 16:44 354次阅读

    SD-WAN视频会议解决方案效果如何?SD-WAN如何加速视频会议

    当今的数字化办公环境中,视频会议已经成为了企业间沟通和协作的重要工具。但是,网络状况不佳和带宽限制等问题可能会对视频会议质量产生影响。幸运的是,SD-WAN(软件定义广域网)技术的运用为优化视频会议
    的头像 发表于 02-28 14:34 321次阅读

    创通联达推出全场景智能视频会议解决方案

    近日,全球领先的物联网产品和解决方案提供商,创通联达在CES2024上重磅推出了其备受期待的全场景智能视频会议解决方案,旨在提升企业沟通与协作的体验和效率,为视频会议领域带来又一创新突
    的头像 发表于 01-12 11:05 512次阅读

    【飞腾派4G版免费试用】3.JITSI视频会议想开就开

    Jitsi Meet 是一个开源项目,它不需要用户支付昂贵的许可费用。这使得它成为一个经济实惠的视频会议解决方案。 扩展性: Jitsi Meet 的扩展性强,你可以在自己的服务器上部署,从而更好地控制
    发表于 12-25 18:44

    高品质万兆园区网络带你领略音视频会议体验升级,沟通无边界,视频零卡顿

    随着互联网的快速发展、企业数字化的不断深入,音视频业务已经成为了企业园区网络中的一项重要业务。大量的企业会在日常工作中把视频会议作为提升办公效率的重要手段。 举例,欧洲的某家知名银行,业务遍及全球
    的头像 发表于 11-16 20:25 406次阅读
    高品质万兆园区网络带你领略音<b class='flag-5'>视频会议</b>体验升级,沟通无边界,<b class='flag-5'>视频</b>零卡顿