0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CV-CUDA 助力腾讯云音视频 PaaS 平台实现视频增强 AI 全流程 GPU 加速

NVIDIA英伟达 来源:未知 2023-07-28 17:05 次阅读

案例介绍

腾讯云音视频 PaaS 平台与 NVIDIA 团队合作,利用CV-CUDA加速视频增强 AI 工作管线中的前后处理模块,结合NVIDIA TensorRT,将视频增强 AI 全流程置于 GPU 上进行加速,前后处理部分效率提升 16% - 38%。

客户简介

腾讯云音视频 PaaS 平台(以下简称腾讯视频云)专注技术产品,构建了行业中极速高清智能转码、超低时延快直播的音视频解决方案,已连续四年居于市场份额和解决方案首位[1],在音视频领域已有超过 21 年的技术积累,腾讯云音视频已持续支持国内 90% 的音视频客户。其中腾讯云 MPS 媒体处理服务为海内外客户提供全场景极速高清转码,音视频增强,专有云 codec SDK 等服务,在近期全球 MSU 云端编码大赛及 SLC 评测中,所参评项目均取得了第一名的好成绩[2]

使用 GPU 加速视频增强 AI 全流程

本案例中,腾讯云音视频 PaaS 平台与 NVIDIA 团队合作,利用CV-CUDA加速视频增强 AI 工作管线中的前后处理模块,结合NVIDIA TensorRT,将视频增强 AI 全流程置于 GPU 上进行加速。集成 CV-CUDA 后相比加速前,前后处理部分效率提升 16% - 38%,端到端效率提升 6% - 10%。

加速画质增强全链路工作管线的挑战

画质增强是腾讯视频云提供的主要视频类云服务之一,其通过 3D 去噪、色彩增强、超分辨率、插帧等处理技术,有效处理噪点、马赛克、抖动、顿挫感等问题,提高画面清晰度,让画质重生。该服务的工作管线基于 ffmpeg filter 构建,整体工作流如下图所示:

5b96b476-2d25-11ee-815d-dac502259ad0.png

图 1. 画质增强工作管线示意图

该服务中应用了三种主要的 AI 模型,包括:去噪模型、色彩增强模型以及超分辨率模型。这些模型的工作管线中,除模型推理外,还包含了一系列前后处理操作,包括:yuv2rgb、copyMakeBorder、normalize、hwc2chw、chw2hwc、float2uint8、rgb2yuv 等。

此前,这些前后处理操作使用自定义的 CUDA 算子在 GPU 上处理或使用 OpenCV 在 CPU 上处理,计算效率并不理想。一方面,这使得前后处理在整个工作管线中占据了可观的开销;另一方面,前后处理可能增加 CPU 负载,影响 CPU 上其他任务的执行效率。因此,如何尽可能地节省前后处理引入的开销,缓解 CPU 负载,成为了加速画质增强全链路工作管线的挑战。

视频增强 AI 前后处理效率提升 16% - 38%

腾讯视频云与 NVIDIA 合作,将 CV-CUDA 集成进去噪模型、色彩增强模型和超分辨率模型的工作流中,替换原有的 CUDA 算子及 OpenCV CPU 算子,从而加速前后处理部分的计算效率,提升 AI 任务端到端的推理效率。下表展示了对于 1080p 输入图像,应用 CV-CUDA 前后,上述三种模型工作管线的处理速度(单位:ms):

5ba6e562-2d25-11ee-815d-dac502259ad0.png

图 2. 使用 CV-CUDA 后,处理

1080p输入图像的效率提升效果

可以观察到,使用 CV-CUDA 后,三种模型的前后处理部分的计算效率有了不同程度的加速,模型整体性能也得以提升。此种性能提升尤其在前后处理耗时占比大的任务中将更加明显。

持续合作,实现视频 AI 全链路 GPU 加速

腾讯视频云未来将持续与 NVIDIA 合作,对提升视频增强服务处理效率方面进行不断地探索。例如,双方将共同尝试引入 TensorRT 最新的特性,进一步加速视频增强各类模型的推理性能;另外,双方将继续推动利用 CV-CUDA 加速更多视频类工作管线的处理,实现视频 AI 全链路 GPU 加速。

准备好开始了吗?

CV-CUDA 抢先体验开发者申请:

https://developer.nvidia.cn/zh-cn/cv-cuda/early-access

[1] 资料来源于腾讯云音讯频开发者社区官网,其数据来源于国际数据公司IDC)发布的《中国视频云市场跟踪(2021 上半年) 》https://cloud.tencent.com/developer/article/2046119。 [2] 资料来源于腾讯云音讯频开发者社区官网,据莫斯科国立大学(MoscowState University)于 2021 年与 2022 年举办的 MSU 云端视频转码大赛(CloudVideo Transcoding Services Comparison)成绩公布https://cloud.tencent.com/developer/article/1794385; https://cloud.tencent.com/developer/article/2057612 。

点击“阅读原文”,或扫描下方海报二维码,在 8 月 8日聆听NVIDIA 创始人兼 CEO 黄仁勋在 SIGGRAPH 现场发表的 NVIDIA 主题演讲,了解 NVIDIA 的新技术,包括屡获殊荣的研究,OpenUSD 开发,以及最新的 AI 内容创作解决方案。

5bbc9ca4-2d25-11ee-815d-dac502259ad0.jpg


原文标题:CV-CUDA 助力腾讯云音视频 PaaS 平台实现视频增强 AI 全流程 GPU 加速

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3842

    浏览量

    91758

原文标题:CV-CUDA 助力腾讯云音视频 PaaS 平台实现视频增强 AI 全流程 GPU 加速

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    艾为电子助力闪极科技发布音视频AI眼镜

    日前,闪极科技发布 “闪极 A1 拍拍镜”。这是一款音视频AI眼镜,搭载国产紫光展锐去蜂窝平台,内置1600万索尼高清摄像头。旅行、日常,轻触镜腿即可拍照摄像,解放双手,所见即拍,无感出行。
    的头像 发表于 01-06 10:49 215次阅读
    艾为电子<b class='flag-5'>助力</b>闪极科技发布<b class='flag-5'>音视频</b><b class='flag-5'>AI</b>眼镜

    AMS-HE200:HDMI音视频网络延长器,开启传输新时代

    在数字化时代,高清音视频传输已经成为各行各业不可或缺的重要技术。无论是安防监控、视频会议,还是户外广告、家庭影院,高清音视频信号的无缝传输都扮演着至关重要的角色。深圳市程达科技有限公司,作为高清
    的头像 发表于 11-27 10:04 211次阅读
    AMS-HE200:HDMI<b class='flag-5'>音视频</b>网络延长器,开启传输新时代

    盘点那些常见音视频接口

    我们熟知的一些常见音视频接口,发展至今在日常使用中已经渐渐少了。但是在工业领域的音视频连接,依然能看到其身影。这些看似消失的接口,它们现在发展成什么样子了?本期我们将做一个大盘点。
    的头像 发表于 09-09 14:34 661次阅读

    常见音视频接口的静电浪涌防护和滤波方案

    音视频接口在现代多媒体设备中扮演着至关重要的角色,它们确保了音视频信号在不同设备间的顺畅传输,各种类型的音视频接口满足了多样化的应用场景需求。 在音视频接口的设计领域,静电浪涌防护与滤
    的头像 发表于 06-25 11:28 737次阅读

    音视频IP化浪潮全面来袭,分布式系统开创音视频行业新时代!

    在传统音视频频系统中,厂商们各自采用不同的通讯方式和控制协议,这使得不同的产品之间就像一座座的信息孤岛,要连接起来就需要复杂的转换设备和系统再开发。随着音视频项目的规模不断扩大,各类音频设备产品
    的头像 发表于 05-30 16:55 710次阅读

    音视频产品EMC整改案例解析

    音视频产品EMCRE整改案例解析
    的头像 发表于 05-20 16:49 491次阅读
    <b class='flag-5'>音视频</b>产品EMC整改案例解析

    高清HDMI转USB 3.0音视频多功能音采集卡-测评

    LCC380的设计理念在于全面考虑到各种用户场景下的需求。为了实现高品质的音视频采集效果,卡体搭载了业界领先的音频处理器解决方案。无论您是热衷于游戏直播、视频会议还是其他音视频应用,都
    的头像 发表于 05-14 17:45 1025次阅读
    高清HDMI转USB 3.0<b class='flag-5'>音视频</b>多功能音采集卡-测评

    【RTC程序设计:实时音视频权威指南】音视频的编解码压缩技术

    音视频所载有的信息在通过传输的时候就需要压缩编码。 其中,文本压缩是指通过使用各种算法和技术,将文本数据表示为更紧凑的形式,以减少存储空间。 霍夫曼编码是一种无损压缩算法,它可以根据字符出现
    发表于 04-28 21:04

    音视频SoC与AI技术融合,带来更智能的音视频处理解决方案

    电子发烧友网报道(文/李弯弯)音视频SoC,即音视频系统级芯片或片上系统,是一种高度集成化的芯片,它将电路板上的多块芯片以及嵌入式软件全部集成到一块芯片中。音视频SoC芯片广泛应用于各种嵌入式系统
    的头像 发表于 04-26 01:20 4635次阅读

    【RTC程序设计:实时音视频权威指南】音频采集与预处理

    音视频通信对音频采集的实时性和性能要求很高。为了降低延迟并提高吞吐量,可能需要采用一些优化技术,如硬件加速、多线程处理等。 最后,音频采集还需要考虑与后续处理步骤的衔接问题。例如,采集到的音频
    发表于 04-25 10:41

    【RTC程序设计:实时音视频权威指南】新书一瞥

    本人从事音视频领域的开发,经常接触实时音视频处理相关的技术,看到这本书非常有兴趣阅读,这本书全面介绍实时音视频(RTC)技术的权威著作,该书详细讲解了RTC的基本概念、技术原理、系统设计以及实际
    发表于 04-22 09:09

    音视频解码生成:打造极致观影体验的关键技术

    在现代多媒体时代,音视频解码生成技术已成为提供极致观影体验的核心要素。它不仅能够确保音视频数据的高效传输,还能保证播放的流畅性和画质清晰度,为用户带来身临其境的观影享受。 1. 解码生成的重要性
    的头像 发表于 02-25 14:43 503次阅读

    音视频解码器硬件加速实现更流畅的播放效果

    随着多媒体内容的日益丰富和高清化,传统的软件解码已经难以满足人们对流畅播放体验的需求。因此,音视频解码器硬件加速技术的出现,为提升播放效果带来了革命性的改变。 硬件加速的原理 硬件加速
    的头像 发表于 02-21 14:40 1045次阅读
    <b class='flag-5'>音视频</b>解码器硬件<b class='flag-5'>加速</b>:<b class='flag-5'>实现</b>更流畅的播放效果

    音视频解码生成在多媒体制作中的应用

    音视频解码生成是多媒体制作中不可或缺的一部分,它扮演着将编码的音视频数据转化为可播放、可编辑的内容的关键角色。在多媒体制作的全过程中,音视频解码生成技术都有广泛的应用。 1. 视频编辑
    的头像 发表于 02-21 14:39 416次阅读

    音视频解码生成与流媒体传输的结合

    音视频解码生成与流媒体传输是现代数字媒体技术中两个不可或缺的部分,它们的结合为用户提供了高质量、实时性的多媒体体验。 1. 解码生成与流媒体传输的关系 解码生成是流媒体传输的前提。在流媒体服务中
    的头像 发表于 02-21 14:36 434次阅读