0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

视频占据过半流量,GPU还是首选的计算硬件吗?

E4Life 来源:电子发烧友原创 作者:Leland 2021-09-23 09:37 次阅读
根据谷歌统计的数据,由于去年疫情带来的增长加速,再加上视频会议、AR/VR与云游戏等应用的兴起,视频服务已经占据整个互联网60%以上的流量。而这也使得服务器端视频处理能力的要求在不断拔高,处理的对象已经不再是1080p 30帧的短视频了,而是对4K以上的HDR视频进行实时转码。

除了开发更高效的视频编码(VP9、AV1等)和媒体框架之外,硬件平台也是不可或缺的一环,市面上也涌现了不少大相径庭的硬件方案。传统的CPU在新编码上早已显得吃力,而GPU虽然性能优越,但计算流量过大,服务器的成本要高出一截,因此不少云服务厂商也开始推出专用硬件来进行视频处理。

传统GPU

GPU作为最常用的视频处理硬件,也理所当然地成为了数据中心视频转码的选择之一。目前常用于视频转码的最新英伟达GPU为T4。该卡包含320个图灵Tensor核心和2560个CUDA核心,单精度算力达到8.1 TFLOPS。英伟达称在独立的硬件转码引擎下,与前代GPU Tesla M60相比,其转码性能提升至2倍,同时支持38个1080p的视频流。

英伟达T4 / Nvidia
除了英伟达之外,AMD也有可用于视频编码的Radeon Pro V520 GPU,根据全球最大的云服务厂商亚马逊AWS公布的数据,其通用图形渲染性能要高出英伟达T4 40%,单卡最多支持6个1080p60的视频流同时编码。

赛灵思媒体加速卡

除了传统的通用GPU方案外,另一个常见的方案就是采用专门的视频处理加速卡,比如赛灵思于去年发布的数据中心媒体加速卡Alveo U30,专用于高密度的视频转码应用。该卡的APU采用了4核Arm Cortex-A53,RPU采用了双核Arm Cortex-R5F,而GPU采用了Arm Mali-400 MP2。U30支持到8路1080p60视频流的编码,而且在功耗和灵活性上优于CPU+GPU的传统方案。

Alveo U30加速卡 / Xilinx

今年9月,亚马逊AWS开放了新的EC2 VT1实例,该实例至多可以扩展至8张赛灵思Alveo U30加速卡。根据亚马逊AWS公布的数据,基于GPU(英伟达T4 GPU+英特尔Cascade Lake CPU)的G4dn实例相比,在H.264/AVC和H.265/HEVC的实时视频编码上,VT1所需的成本比后者低上60%,与基于CPU(AMD EPYC 7002)的C5实例相比,成本更是低上60%。

除此之外,赛灵思还会提供其视频转码SDK,不仅整合了FFMpeg,更有媒体加速API与U30上的编解码器直连,今年年末还会推出对于另一框架GStreamer的支持。

亚马逊不仅推出了基于这类加速卡的云服务,旗下的直播平台Twitch也在使用这类实例。Twitch称计划将VT1实例用于数百万计的直播转码,以此实现在更密集的串流和低延迟下,不牺牲视频的压缩或画质。

谷歌定制VPU

作为仅次于亚马逊AWS和微软Azure的云服务厂商,谷歌在其公共云服务上依然在使用传统的GPU方案。但坐拥全球最大的视频平台Youtube和成立不久的云游戏平台Stadia,谷歌决定在这些服务上采用自己的硬件来加速视频处理。

搭载了两个VCU芯片PCBA / Google

作为视频编码标准VP9的开发者,谷歌想要同时实现H.264和VP9支持,以及多输出的转码,并在直播与离线转码中达到理想的速度与质量,还能全面控制软件算法进行调整,因此谷歌决定开发自己的硬件VCU芯片。

谷歌基于该硬件打造的系统具有两张VCU加速器,每个加速器内置了10个VCU编码器核心,每个核心都能够实时编码2160p的视频流,使用三个参考帧时可达60FPS。经过在H.264二次编码上的输出对比,8块VCU芯片的性能是4块英伟达T4性能的两倍以上,是英特尔Skylake CPU的8倍以上,在VP9编码上的性能差距更是可以拉到20倍。

结语

在视频处理方面,尤其是视频编码转码上,CPU+GPU的通用传统方案已经在失去其优势,专用的加速器方案明显在成本和性能突破上走的更快一些。这种趋势在数据中心的其他应用领域上也在慢慢显现,比如深度学习AI等,专用加速器的方案更适合针对性更强的场景。随着云服务厂商不断推出更多的专用实例,GPU在视频处理上的地位很可能会被专用加速器给替代。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4752

    浏览量

    129042
  • 数据中心
    +关注

    关注

    16

    文章

    4804

    浏览量

    72208
收藏 人收藏

    评论

    相关推荐

    《CST Studio Suite 2024 GPU加速计算指南》

    的各个方面,包括硬件支持、操作系统支持、许可证、GPU计算的启用、NVIDIA和AMD GPU的详细信息以及相关的使用指南和故障排除等内容。 1.
    发表于 12-16 14:25

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--了解算力芯片GPU

    本篇阅读学习第七、八章,了解GPU架构演进及CPGPU存储体系与线程管理 █从图形到计算GPU架构演进 GPU图像计算发展 ●从三角形开始
    发表于 11-03 12:55

    常见GPU问题及解决方法

    GPU(图形处理单元)是计算机硬件的重要组成部分,负责处理图形和视频渲染任务。随着技术的发展,GPU在深度学习、游戏、视频编辑等领域扮演着越
    的头像 发表于 10-27 14:12 1548次阅读

    如何提高GPU性能

    在当今这个视觉至上的时代,GPU(图形处理单元)的性能对于游戏玩家、图形设计师、视频编辑者以及任何需要进行高强度图形处理的用户来说至关重要。GPU不仅是游戏和多媒体应用的心脏,它还在科学计算
    的头像 发表于 10-27 11:21 586次阅读

    如何选择适合的GPU

    在现代计算领域,GPU(图形处理单元)的作用已经远远超出了传统的图形渲染。从深度学习到科学计算,再到视频编辑,GPU都在发挥着越来越重要的作
    的头像 发表于 10-27 11:07 343次阅读

    GPU加速计算平台是什么

    GPU加速计算平台,简而言之,是利用图形处理器(GPU)的强大并行计算能力来加速科学计算、数据分析、机器学习等复杂
    的头像 发表于 10-25 09:23 260次阅读

    GPU计算主板学习资料第735篇:基于3U VPX的AGX Xavier GPU计算主板 信号计算主板 视频处理 相机信号

    GPU计算主板学习资料第735篇:基于3U VPX的AGX Xavier GPU计算主板 信号计算主板
    的头像 发表于 10-23 10:09 287次阅读
    <b class='flag-5'>GPU</b><b class='flag-5'>计算</b>主板学习资料第735篇:基于3U VPX的AGX Xavier <b class='flag-5'>GPU</b><b class='flag-5'>计算</b>主板 信号<b class='flag-5'>计算</b>主板 <b class='flag-5'>视频</b>处理 相机信号

    动画渲染用GPU还是CPU的选择思路

    对话Imagination中国区董事长:以GPU为支点加强软硬件协同,助力数【白皮书下载】分布式功能安全的创新与突破本文来源:渲染101动画渲染动画渲染是一个计算密集型的过程,需要强大的硬件
    的头像 发表于 09-28 08:05 271次阅读
    动画渲染用<b class='flag-5'>GPU</b><b class='flag-5'>还是</b>CPU的选择思路

    InConnect维护设备的流量是多少

    :需要根据实际视频流量计算 4、工业路由器产品每月的云平台连接流量+维护隧道建立流量约30MB-40MB,一年约360MB-480MB,单台设备每月InConnct链接心跳
    发表于 07-25 07:23

    信号计算主板设计方案:735-基于3U VPX的AGX Xavier GPU计算主板

    3U VPX导冷结构 , FPGA信号预处理 , GPU显卡 , PCIE视频处理 , GPU计算主板
    的头像 发表于 07-18 11:31 483次阅读
    信号<b class='flag-5'>计算</b>主板设计方案:735-基于3U VPX的AGX Xavier <b class='flag-5'>GPU</b><b class='flag-5'>计算</b>主板

    恒讯科技的GPU云解决方案有什么特点和优势?

    GPU云解决方案的主要特点和优势: 1、弹性计算能力:用户可以根据自己的需求快速扩展或缩减计算资源,而无需投资昂贵的硬件设备。 2、高性能并行处理:
    的头像 发表于 06-12 17:24 409次阅读

    为什么GPU对AI如此重要?

    来渲染图形和图像的计算机芯片专业和个人计算。最初,GPU负责渲染2D和3D图像、动画和视频,但现在它们的应用范围更广,尤其在人工智能领域。GPU
    的头像 发表于 05-17 08:27 716次阅读
    为什么<b class='flag-5'>GPU</b>对AI如此重要?

    FPGA在深度学习应用中或将取代GPU

    、运动和电力限制等环境因素。 Larzul 说:“在一些关键的应用场景中,比如智慧城市的视频监控,要求硬件暴露在对 GPU 有不利影响的环境因素 (比如太阳) 下。“ GPU 受晶体管
    发表于 03-21 15:19

    gpu是什么和cpu的区别

    GPU(Graphics Processing Unit)是一种专门设计用于处理图形和视频的处理器。最初,GPU的主要功能是处理计算机游戏和图形设计中的复杂图形操作,但随着技术的发
    的头像 发表于 02-20 11:24 1.9w次阅读

    电线安全载流量计算方法

    电线的安全载流量是指电线能够安全地承受的最大电流。计算电线的安全载流量需要考虑电线的材质、截面积、长度、散热条件等因素。下面将详细介绍电线安全载流量
    的头像 发表于 01-16 10:51 2848次阅读