0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何通过分块编码和分块传输CMAF

LiveVideoStack 来源:未知 作者:李倩 2018-10-29 15:16 次阅读

刚落幕的LiveVideoStackCon 2018音视频技术大会上,Akamai媒体业务群首席架构师William Law通过主题演讲介绍了如何通过分块编码和分块传输CMAF,为观众提供极低延迟的视频直播服务。本文由Akamai整理,并授权LiveVideoStack发布。

对于当今年轻人,电视早已没什么吸引力,大家更喜欢通过网络追剧、看比赛,甚至看各种直播内容。那么延迟到底会有多重要?为什么要强调低延迟?

假设你和邻居都在自己家看足球赛,邻居看电视直播,你看网络直播。邻居那边已经在为进球欢呼,你这边因为延迟,球员才准备起脚射门……你说低延迟重不重要。

面对数量激增的用户和复杂的网络环境,如何为观众提供更流畅的播放体验,并且对直播类节目提供低延迟快速高效的内容交付,已成为很多视频平台最关心,并且投入最多资源进行改善的领域之一。

那么「分块编码」和「分块传输」的「CMAF」到底是什么?

CMAF,一种全新的「容器」格式

随着HTTP自适应流媒体(HAS)技术的发展,视频直播观众对OTT质量和延迟提出了更高要求,甚至堪比传统广播电视节目。然而业内通常认为,HAS交付内容不可避免会遇到端到端延迟,甚至可能长达视频片段时长的数倍,自然无法比拟广播电视效果。但这种观点已经站不住脚了,现在已经有HAS解决方案能将这种端到端延迟降低到远低于一个片段时长的程度,甚至可以让整体延迟与片段时长完全无关,这个解决方案就是超低延迟CMAF(ULL-CMAF)。

CMFA(Common Media Application Format,通用媒体应用程序格式)由标准化组织MPEG在2017年正式颁布,这种格式定义了一种碎片化的MP4容器,其中可以封装视频、音频及文本数据。该格式最大的特点在于,能高效地让HLS播放列表同时引用多个媒体片段和DASH清单,同时还在DASH ATSC3广播配置文件的继承方面实现了很多优势,有助于进一步降低延迟。

但简单来说,只使用CMAF片段还不足以降低延迟,CMAF容器还必须与编码器、CDN以及客户端行为完全匹配,在整个系统范围内实现低延迟。

图1:CMAF的对象命名

分块编码,化整为零提效率

降低延迟的第一步是分块编码。按照MPEG CMAF标准,CMAF轨道由多个对象组成,如图1所示。「块」是最小的可引用单位,其中至少包含一个moof 和一个mdat原子(Atom)。一个或多个块组合在一起形成一个片段,而一个或多个片段还可进一步组合成一个片段。

标准的CMAF媒体片段将使用一个moof 和一个mdat 原子进行编码,如图2所示。其中mdat还包含一个IDR(Instantaneous Decoder Refresh,瞬时解码器刷新)帧,每个片段开头都会有。

图2:CMAF段的分块编码

虽然每个「分块编码」片段会包含一系列「块」,即多个moof/mdat 元(Tuple)组成的序列,如图2所示,但只有第一个元具备IDR帧。将片段分解为更短的碎片,这样做好处在于编码器能在编码完成后立即输出每个块。块数量相同的情况下,这种「提前」输出的做法可显著降低整体延迟。

分块传输,合零为整降延迟

接下来需要考虑如何实现分块传输。

图3:HAS媒体分发系统

编码器会使用HTTP 1.1分块传输编码机制,将编码后的CMAF块推送至源位置。例如,对于一个产生4s 30fps片段的编码器,将每4秒发出一个HTTP POST请求(每个请求对应一个片段),在接下来的4秒里,共有120个块(每个块时长为33毫秒)构成一个完整的片段,并发送至源位置。但编码器并不会对每个单独的块发出一个POST请求。

接下来,这个块会通过拉取的方式到达播放器。播放器读取清单或播放列表,了解内容描述信息,随后计算希望开始播放的位置起点,并向对应片段发出请求。清单中必须列出片段数据的早期可用性。对于MPEG DASH,这是通过MPD@availabilityTimeOffset参数实现的。

图4:视频直播过程中,播放器的启动选项

我们可以用图4所示过程为例,演示播放器起始播放算法对整体延迟的影响。这是一个会产生2秒片段的直播编码器。图中可见,系统正处于产生片段5的过程中。对于不分块解决方案,为了尽可能降低延迟,必须从上一个完整可用片段(片段4)开始播放,这会导致整体延迟增加3秒。但如果使用每500毫秒(仅供示例,实际中分块时长远低于500毫秒)一个片段进行分块编码,播放器就可从包含IDR的上一个块(块5a)开始播放,此时延迟可降低至1秒。

此外,还有两种方法可以进一步降低延迟。首先,播放器可以下载块5a和块5,但在开始播放前就从块5a向前解码块5b,这样可将延迟降低至500毫秒以内。第二种方法,播放器可将播放过程延迟1秒,随后在块6a生成后立即发出请求,这样也可以降延迟降低到500毫秒以内。

ULL-CMAF前提要求总结

总的来说,只有在全部满足下列要求的情况下,才能通过ULL-CMAF获得稳定的低延迟交付:

CMAF片段中的内容是分块编码的;

编码器调整DASH清单/HLS播放列表,以适应并标注自己使用了分块编码的方式,并借此告知数据的早期可用性;

编码器使用HTTP 1.1分块编码传输机制将内容推送至源分发位置;

CDN在分发链上的每个环节,都使用HTTP分块编码传输机制传播内容,并最终到达客户端;

而客户端也需要全部满足下列要求:

对片段请求进行精确计时,并在一个片段的有效时长内请求所需片段;

在收到比特流后立即解码,而不要等待片段结束。浏览器中使用的HTML5播放器必须使用Fetch而非XHR API,因为Fetch可以在数据下载完成前立即读取响应的正文内容;

具有估算吞吐量的方案,因为此时无法使用标准的Segment-timing技术;

缓冲区和自适应逻辑必须能应对非常低的缓冲;

由于吞吐量波动,能够在滞后于现场的情况下立即「赶超」。

所以说了半天,这种技术的效果到底如何?亲自体验一下吧。请使用Google Chrome浏览器(其他浏览器可能无法支持)访问:

http://mediapm.edgesuite.net/will/dash/lowlatency/low-latency-public-example.html

该演示使用由开源FFmpeg生成的直播流,发布至Akamai Media Services liveOrigin™,并通过Akamai Media Delivery网络交付,在客户端使用开源播放器dash.js播放。视频流为AVC 720p编码,码率2Mbps,片段时长6秒,每1帧的块时长29.97fps,availabilityTimeOffset设置为5.967秒,延迟目标设置为2.8秒,视频流在美国波士顿进行编码。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1129

    浏览量

    40671
  • 编码器
    +关注

    关注

    45

    文章

    3584

    浏览量

    134110
  • 编码
    +关注

    关注

    6

    文章

    935

    浏览量

    54759

原文标题:William Law:CMAF如何支持的超低延迟视频直播

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    采用分块管理和状态转换的嵌入式NOR Flash管理

    分块管理层程序负责资源回收算法、开机Flash 异常恢复算法的实, 同时向数据类型管理层提供各种类型数据的所在的分块地址信息。
    发表于 05-01 11:45 1363次阅读
    采用<b class='flag-5'>分块</b>管理和状态转换的嵌入式NOR Flash管理

    labview数据分块

    我这里有一组数据,是不断采样得到的,采样率1000Hz,采样点1000,我想要将每一次采样得到的1000个数据进行分块处理,每次拿出来32个数据进行运算,相当于每32个数分成一块,一块一块的进行处理运算。这个应该怎么处理。。。求大神解答,谢谢!!!
    发表于 11-19 22:40

    CC2540 数据分块处理怎么实现?

    CC2540 数据分块处理怎么实现?用cc2540和ANDROID手机连接,在CC2540里做了一个5秒的数据处理,执行的过程中模块会和手机断开连接。猜测应该是处理时间太长达到了BLE通信的大间
    发表于 03-15 16:56

    FPGA怎么对引脚进行分块?DDR3与FPGA的引脚连接

    FPGA如何对引脚进行分块?是由VCC的电压不同进行自行设计分块?还是每个块的引脚都是固定的?在进行DDR3与FPGA的硬件连接时,由FPGA的芯片手册得采用SSTL_15电压标准,即VDDQ
    发表于 11-29 16:10

    分块广义对角占优矩阵的条件

    根据块对角占优和广义块对角占优矩阵的概念,在原有点H矩阵的基础上,应用分块技术,研究给出了分块广义对角占优矩阵的一个简捷实用的充分条件和一个必要条件,推广了相
    发表于 12-10 17:30 9次下载

    空间数据库的分块多级索引机制的研究

    为了解决常见的空间索引机制存在的不足,构造一个高性能的空间索引机制,通过分块的线性可排序四叉树与空间范围查询相结合的方法,提出了基于空间数据库的分块多级空间
    发表于 01-15 16:32 15次下载

    分块云计算简介

    分块云计算简介 这篇文章没有什么新奇观点,只是将我的思考与观察做一个概括。   多年忽视分块   即使过了16年,我依然
    发表于 04-12 09:52 1077次阅读
    <b class='flag-5'>分块</b>云计算简介

    分块NSA在人脸识别上的应用

    分块NSA 方法首先对图像矩阵进行分块,对分块得到的子图像矩阵再利用NSA进行鉴别分析。这样做有以下2个优点:1)能有效地抽取图像的局部特征,对人脸表情和光照条件变化较大的图
    发表于 08-15 10:37 28次下载
     <b class='flag-5'>分块</b>NSA在人脸识别上的应用

    C语言教程之分块查找

    C语言教程之分块查找,很好的C语言资料,快来学习吧。
    发表于 04-22 11:06 0次下载

    基于分块DCT的自适应视频水印算法_蒋凯来

    基于分块DCT的自适应视频水印算法_蒋凯来
    发表于 03-17 16:06 2次下载

    基于分块颜色矩和灰度共生矩阵的图像检索_岳磊

    基于分块颜色矩和灰度共生矩阵的图像检索_岳磊
    发表于 03-17 09:57 1次下载

    基于位串内容感知的数据分块算法

    针对基于内容的可变长度的分块CDC算法中数字签名计算需要耗费大量CPU开销的问题,提出了一种基于位串内容感知的数据块分块算法。算法利用每一次失败匹配尝试所带来的位特征信息,最大限度地排除不能匹配
    发表于 11-24 15:00 0次下载
    基于位串内容感知的数据<b class='flag-5'>分块</b>算法

    分块式空间望远镜波前探测与控制

    为了满足高分辨率对地观测的需求,突破运载对望远镜口径的限制,需要采用分块式望远镜,而分块式望远镜的空间应用对波前传感与控制提出了极高的要求。建立了分块式空间望远镜光学系统模型,依据分块
    发表于 01-23 15:58 1次下载

    如何通过CMAF提供海量并发的低延迟流媒体服务的

    Akamai拥有编码器验证流程,并且目前拥有5个经过CMAF超低延迟解决方案认证的编码器。相比之下,它有13个通过其当前标准的10~12秒延迟媒体服务产品认证的
    的头像 发表于 10-15 15:49 3355次阅读

    基于神经网络的循环程序分块大小预测

    循环程序的优化一直是程序优化的重点,循环分块作为一种典型的循环程序优化技术已被广泛地研究和应用。分块大小的选择对循环程序的性能有着重要影响,分块大小的选择复杂多变且高度依赖程序和硬件。传统的静态分析
    发表于 05-13 11:05 13次下载