0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何利用神经网络改善Netflix视频质量

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2022-12-13 09:16 次阅读

作者:Christos G. Bampis,Li-Heng Chen and Zhi Li

当你在狂热地观看最新一季的 《怪奇物语》或《黑钱胜地》时,我们努力为你提供最好的视频质量。为此,我们不断突破流媒体视频质量的界限,并利用最好的视频技术。例如,我们投资于下一代、免版税的编解码器和复杂的视频编码优化。最近,我们为平台添加了另一个强大的工具:用于视频降分辨率的神经网络。在这篇技术博客中,我们描述了我们是如何利用神经网络改善Netflix视频质量的,我们面临的挑战以及未来的发展。

我们如何在Netflix视频编码流程中使用神经网络?粗略地说,在我们的编码视频流程中有两个步骤:

1. 视频预处理,它包括编码前应用于高质量源视频的任何转换。视频降分辨率是这里最相关的例子,它根据不同设备的屏幕分辨率定制我们的编码,并在不同的网络条件下优化图像质量。通过视频降分辨率,一个源视频能产生多个分辨率的视频。例如,一个4K源视频将被缩小到1080p、720p、540p等。这通常是通过传统的滤波器来完成的,比如Lanczos算法.

2. 视频编码,使用传统的视频编解码器,就像AV1。编码通过利用视频中存在的空间和时间冗余,大大减少了需要通过流传输到设备的视频数据量。

我们认为,我们可以利用神经网络来提高Netflix的视频质量,方法是用神经网络代替传统的滤波器来进行视频降分辨率。这种被我们称为“深度降分器”的方法有几个关键的优点:

•一种基于学习的方法可以提高视频质量,并针对Netflix内容进行定制。

•它可以看做是一个直接替代方案,也就是说,我们不需要在Netflix编码端或客户端设备端进行任何其他更改。数以百万计的支持Netflix流媒体的设备自动受益于此解决方案。

•一个基于神经网络的视频处理模块可以被独立开发,可以在视频降分辨率之外使用,并且可以与不同的编解码器相结合。

当然,我们相信神经网络在整个视频应用中的革命性潜力,不仅仅是视频降分辨率。虽然传统的视频编解码器仍然流行,基于神经网络的视频编码工具蓬勃发展,并缩小了压缩效率方面的性能差距。深度降分器是我们用神经网络改善视频质量的实际方法。

Instagram会为用户上传的视频创建多种编码版本,不同版本间各有特性。而只要利用一种类型的视频编码辅助生成另一种类型,即可将观看次数较少的视频所占用的编码计算资源减少94%。由此释放出的更多资源可用于生成更多高清编码视频流,让更多用户获得更清晰、更流畅的播放体验。

基于神经网络的视频降分辨率方法

深度降分器是一种神经网络架构,旨在通过学习更高质量的视频尺度器来提高端到端的视频质量。它由两个构建模块组成,一个预处理模块和一个调整大小模块。预处理块的目的是在调整大小操作之前对视频信号进行预滤波。调整大小块产生作为编码器输入的低分辨率视频信号。我们采用了自适应网络设计,适用于各种各样的实际编码中会用到的分辨率。

e4297aee-7a79-11ed-8abf-dac502259ad0.png

深压缩模型的体系结构,由预处理模块和调整大小模块组成。

在训练过程中,我们的目标是生成最佳的降分表示,以使得在升分以后后均方误差被最小化。因为常规的视频编码器是不能微分的,我们在将其排除在考虑之外。在客户端的升分器是bicubic的前提下,我们集中训练一个鲁棒的深度降分器。我们的训练方法是直观的,并且产生的降分器并不和特定的编码器及其相关实现方式相关联。尽管如此,我们需要对训练结果进行彻底的评估,以证明它在Netflix编码流程里的广泛应用潜力。

利用神经网络改善Netflix视频质量

深度降分器的目标是提高Netflix端到端的视频质量。通过我们的实验,包括客观测量和主观视觉测试,我们发现深度深压缩提高了各种传统视频编解码器和编码配置的质量。

例如,对于VP9编码,并假设一个bicubic升分器,我们测量到深度降分器比传统的Lanczos降分方法平均提高了5.4%的VMAF Bjøntegaard-Delta (BD)率。我们还测量了约4.4%的VMAF-NEG BD率的增益。下面我们展示了Netflix标题中的一个例子。深度降分器(红点)在类似比特率下提供了更高的VMAF,或在更低比特率下产生类似的VMAF分数。

e44fb376-7a79-11ed-8abf-dac502259ad0.png

除了客观的测试以外,我们还进行了主观测试研究,以验证深度降分器的主观视觉改善。在我们的基于偏好的视觉测试中,我们发现,约77%的测试受试者在编码配方和升级算法的广泛范围内更喜欢深度降分器呈现的最终质量。受试者报告了更好的细节保存和更清晰的视觉外观。个可视化的例子如下所示。

我们还进行了A/B测试,以了解深度降分器对流媒体播放的整体影响,并尝试检测任何设备的播放问题。通过A/B测试,我们看到了QoE的改善,并确认了深度降分器并没有对某些设备产生不利的影响。

我们如何有效地大规模部署神经网络?

鉴于我们的规模,应用神经网络可能导致编码成本的显着增加。为了有一个可行的解决方案,我们采取了几个步骤来提高成本效率。

•深度降分器的神经网络架构的设计原则是:在避免负面的视觉质量影响的前提下提升计算效率。例如,我们发现只需几个神经网络层就足以满足我们的需求。为了进一步减少输入通道的使用,我们只对亮度通道采用神经网络,而对色度通道采用传统的Lanczos滤波器进行缩放。

•深度降分器的实现使用了FFmpeg软件的滤波器接口。这样的好处是可以与其他视频转换(如像素格式转换)等已实现的功能一起运行。我们的过滤器可以在CPUGPU上运行。在一个CPU上,我们利用Intel的oneDnn以进一步减少延时。

将神经网络集成到我们的下一代编码平台中

Netflix 的编码技术团队和媒体云工程团队共同创新开发了名为Cosmos 的下一代编码平台。通过深度降分器在其上面的实现,我们很好地展示了Cosmos能够如何推动Netflix未来的媒体创新。下图显示了深度降分器是如何被集成到Cosmos的编码微服务中来的。

e484577a-7a79-11ed-8abf-dac502259ad0.png

将神经网络集成到我们的下一代编码平台中

Cosmos编码微服务可以应用于多个编码工作流程。例如,可以调用其服务来分析视频的复杂度,或者生成用于实际Netflix流媒体的编码。其底层函数是一个无服务器层,专门用于运行无状态和密集型计算。在底层函数调用中,我们的深度降分器是在编码之前应用的。在Cosmos的推动下,我们可以利用Titus基础设施并在我们所有的多CPU/GPU环境中大规模运行深度降分器。

下一步

深度降分器为在Netflix视频编码中的更多地使用神经网络应用铺平了道路。我们的创新尝试才刚刚开始。例如,我们正在研究一些其他的案例,比如视频去噪。我们也在寻找更有效的大规模部署神经网络的方案。我们也在研究如何在下一代编码器中应用基于神经网络的工具。

审核编辑:郭婷


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4765

    浏览量

    100568
  • 编解码器
    +关注

    关注

    0

    文章

    253

    浏览量

    24209

原文标题:Netflix:用神经网络改善视频质量

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    BP神经网络和卷积神经网络的关系

    BP神经网络(Backpropagation Neural Network)和卷积神经网络(Convolutional Neural Network,简称CNN)是两种在人工智能和机器学习领域
    的头像 发表于 07-10 15:24 1270次阅读

    BP神经网络和人工神经网络的区别

    BP神经网络和人工神经网络(Artificial Neural Networks,简称ANNs)之间的关系与区别,是神经网络领域中一个基础且重要的话题。本文将从定义、结构、算法、应用及未来发展等多个方面,详细阐述BP
    的头像 发表于 07-10 15:20 867次阅读

    卷积神经网络视频处理中的应用

    卷积神经网络(Convolutional Neural Networks,CNN)作为深度学习的代表算法之一,在计算机视觉领域取得了显著成就,特别是在视频处理方面。本文将深入探讨卷积神经网络
    的头像 发表于 07-09 15:53 549次阅读

    如何利用Matlab进行神经网络训练

    ,使得神经网络的创建、训练和仿真变得更加便捷。本文将详细介绍如何利用Matlab进行神经网络训练,包括网络创建、数据预处理、训练过程、参数调整以及仿真预测等步骤。
    的头像 发表于 07-08 18:26 1701次阅读

    rnn是递归神经网络还是循环神经网络

    RNN(Recurrent Neural Network)是循环神经网络,而非递归神经网络。循环神经网络是一种具有时间序列特性的神经网络,能够处理序列数据,具有记忆功能。以下是关于循环
    的头像 发表于 07-05 09:52 503次阅读

    rnn是什么神经网络

    Network)相比,RNN能够处理时间序列数据,例如文本、音频、视频等。 RNN的基本概念 1.1 什么是RNN RNN是一种具有循环连接的神经网络,其核心思想是将前一个时间步的输出作为下一个
    的头像 发表于 07-05 09:49 583次阅读

    递归神经网络是循环神经网络

    递归神经网络(Recurrent Neural Network,简称RNN)和循环神经网络(Recurrent Neural Network,简称RNN)实际上是同一个概念,只是不同的翻译方式
    的头像 发表于 07-04 14:54 648次阅读

    循环神经网络和卷积神经网络的区别

    循环神经网络(Recurrent Neural Network,RNN)和卷积神经网络(Convolutional Neural Network,CNN)是深度学习领域中两种非常重要的神经网络
    的头像 发表于 07-04 14:24 1144次阅读

    深度神经网络与基本神经网络的区别

    在探讨深度神经网络(Deep Neural Networks, DNNs)与基本神经网络(通常指传统神经网络或前向神经网络)的区别时,我们需要从多个维度进行深入分析。这些维度包括
    的头像 发表于 07-04 13:20 695次阅读

    反向传播神经网络和bp神经网络的区别

    反向传播神经网络(Backpropagation Neural Network,简称BP神经网络)是一种多层前馈神经网络,它通过反向传播算法来调整网络中的权重和偏置,以达到最小化误差的
    的头像 发表于 07-03 11:00 695次阅读

    bp神经网络和卷积神经网络区别是什么

    BP神经网络(Backpropagation Neural Network)和卷积神经网络(Convolutional Neural Network,简称CNN)是两种不同类型的人工神经网络,它们在
    的头像 发表于 07-03 10:12 1051次阅读

    卷积神经网络训练的是什么

    卷积神经网络(Convolutional Neural Networks,简称CNN)是一种深度学习模型,广泛应用于图像识别、视频分析、自然语言处理等领域。本文将详细介绍卷积神经网络的基本概念、结构
    的头像 发表于 07-03 09:15 353次阅读

    卷积神经网络的原理与实现

    1.卷积神经网络(Convolutional Neural Networks,简称CNN)是一种深度学习模型,广泛应用于图像识别、视频分析、自然语言处理等领域。 卷积神经网络是一种前馈神经网络
    的头像 发表于 07-02 16:47 501次阅读

    卷积神经网络和bp神经网络的区别

    卷积神经网络(Convolutional Neural Networks,简称CNN)和BP神经网络(Backpropagation Neural Networks,简称BPNN)是两种
    的头像 发表于 07-02 14:24 3077次阅读

    神经网络在数学建模中的应用

    数学建模是一种利用数学方法和工具来描述和分析现实世界问题的过程。神经网络是一种模拟人脑神经元结构和功能的计算模型,可以用于解决各种复杂问题。在数学建模中,神经网络可以作为一种有效的工具
    的头像 发表于 07-02 11:29 848次阅读