0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

小米技术委标准与新技术部音视频标准总监《互联世界》演讲实录

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2020-12-16 10:38 次阅读

2020 年 11 月 19 日,第四届 EmTech China 全球新兴科技峰会于苏州市相城区召开。作为在全球享有盛誉,以权威见解深度解读全球科技趋势的盛会之一,《麻省理工科技评论》 的 EmTech 系列峰会已成为全球最具影响力的科技会议风向标。今年,EmTech China 2020 继续以技术与商业的结合为主线,数十位世界顶级科学家、海内外院士、商业领袖、科创精英莅临现场,探讨新兴科技发展现状及其为人类社会带来的巨大影响。此外,《麻省理工科技评论》“50 家聪明公司” 2020 年榜单也在现场重磅发布。

会上,小米技术委标准与新技术部音视频标准总监 Mary-Luc Champel 分享了以《互联世界》为主题的演讲。以下为经过整理的演讲实录:

之前演讲的嘉宾认为我们这些大的互联网公司扼杀了小型的初创公司,其实我们小米的模式是不一样的。小米的模式是建立生态系统,鼓励每个人加入到平台上来。今天我想跟大家介绍一下,类似小米这样的互联网公司,在 5G 服务上的多媒体编码是如何做的,我们有很多的创新,这些创新会影响到大家。

小米的模式是建立生态系统

首先我想给大家介绍一下为什么我们有这样的创新,然后给大家介绍体积视频、未来的 XR 服务以及应用于 5G 服务的视频编解码器。今年很多领域的发展是非常迅猛的,体积视频、未来的 XR 服务是我们日后的发展趋势。再然后我想跟大家介绍一下媒体传输,媒体传输是如何影响未来的。最后我想展望一下未来,也就是看一下 6G 服务未来的发展如何,我相信未来 5-10 年 6G 服务会实现。

现在有层出不穷的新型服务和新型用途,这给我们带来了新的挑战。当然我们还可能有新的媒体形式,比如几年前出现的媒体形式有图片、视频等。现在我们有 3D 视频,3D 视频更加复杂,是加强版的视频,同时还有 VR、AR 以及游戏等。

当然这些新的媒体、新的服务要求我们有更高的带宽、更低的时延。比如玩游戏播放视频时,速度不够快就会有时延;比如现场直播,你关注的足球队正在参加世界杯,如果在临门一角的关键时刻视频卡顿了,观众就会非常着急。现在很多国家的用户需要居家隔离,带宽的使用在大大增加。

一些用户在家办公,他们需要使用视频会议的方式进行交流。另外学生进行在线教育学习时,如果在线学习平台不能支持流畅的视频播放,家长和孩子们肯定会受到很大的影响。娱乐设施也会用到很多的带宽。这些都需要更好的编解码器,更好的带宽管理以及更好的传输解决方案。在小米,我们的任务是克服这些新挑战,以简单易用的方式为我们的用户提供新服务。

现在的视频编解码器普遍使用 H.264 标准,它在 2003 年就被提出来,为什么大家现在还在使用?因为它比较便宜,而且直到现在还是非常强大的技术。在 2013 年,VP9、H.265 (HEVC) 标准被制定,相比于 H.264,在同等视频质量下可以节省近 50% 的传输码流。

在 2018 年,一些公司成立了开放媒体联盟(AOM)组,提供可免费使用的编解码器 AV1,AV1 比 HEVC 标准下的编解码的性能较好一些。但因为它没有获得足够的硬件支持,所以到目前为止取得了较小的成功。在 2020 年,H.266 (VVC)、MPEG-5 (EVC) 和 MPEG-5 (LCEVC) 标准被制定,其中,H.266(VVC)标准是由 ISO 和 ITU 联合制定的。MPEG-5 (EVC) 标准是基于历史悠久的工具做的,因此可以免费使用,该标准采用了有限数量的新工具来实现更高的压缩效率。

大家看到的是视频编解码器整体的变化趋势,小米一直在密切关注这种变化趋势,而且关注的重点在 3GPP 领域。3GPP 主要研究面向 5G 服务的视频编解码器(包括下一代编解码器,如 VVC 和 EVC)。小米现在也在关注 5G 的发展,我们想看一下未来整个的应用趋势和未来的编解码器解决方案,考虑是否可以在相同视频质量水平下降低所需的压缩码率,或者可以在相同压缩码率下提高视频质量。

另外 3GPP 已经探索出了评估编解码器的多种用途,这些用途包括是不是纯高清流媒体、4K 电视服务、在线游戏、屏幕以及内容分享等等。针对每一个应用都提供了测试序列,在编码时也考虑了操作的限制,比如在有时延的情况下用户很难有愉快的游戏体验。另外对于 AVC 和 HEVC,我们使用行业公认的衡量标准,公认的衡量标准包括 PSNR、SSIM 和 VMAF。

二维视频、三维视频和体积视频

在这些领域我们已经花了大概两年多的时间进行研究,接下来我想给大家介绍体积视频,我们之前讲的是二维视频和三维视频,接下来讲的加强版的视频类型是体积视频。体积视频可以移动,当你移动自己的时候就会产生 3D 的体验,用户可以看到不同深度的东西。在这里我们可以看到这个视频,虽然是平面的视频,但是如果你在其中就可以体验到体积效果,感受到体积效果的原因是它支持交互式视差。我们从参考视频和深度图中渲染这些帧,编码的内容包括视频、深度图以及遮挡物体地图,利用这些数据我们可以得到重建帧。

另外,小米在做一些场景描述的工作,如果要让用户有更加丰富的体验,我们必须将视频和音频相结合,而且将 3D 的内容和互动的内容加入其中。目前是没有这样的技术能把这些全都整合到一块。

同样还有一点非常重要,就是我们关注与研究的点云编码 (PCC) 方向,也就是点以及空间的编码。点云中有数不清的点,它可以用于实时直播,你可以让这里面的人物旋转,还可以有渲染的功能。点云也可以应用于 3D 物体,即用于环境监测的雷达,用雷达监测出来的复杂场景可以变成 3D 的点云。3D 点云视频也可以应用在文化遗迹的捕捉上,可以用于保护我们的文物古迹。

MPEG 的 PCC 中有两种技术方法,一种是基于视频的编码方法 VPCC,另一种是基于几何的编码方法 GPCC。VPCC 采用传统的视频编解码器来处理点云,这是非常好的解决方案,这种方法可以用于密集和动态点云的压缩。GPCC 方法适用于稀疏的点云数据,下一代 GPCC 将会支持动态点云。该方法采用几何编码,将点云数据放入一个立方体,该立方体会被划分成 8 个子立方体,根据每个子立方体的空间占用模式对它们进行迭代划分,直至子立方体中只有一个点。

这是我们推导出来的空间占用模式。在编码时,点的查找路径中有很多冗余信息,GPCC 可以帮助减少这些冗余,从而减少编码所需比特,因此 GPCC 是非常有潜力的一种编码方法。上个月 MPEG 刚刚完成了 GPCC 第一版的编码器。可以给大家看一下我们实现的编码方法,大家可以看到小的立方体全都已经被创建出来了,可以逐渐确定它的占用模式。

XR 技术可帮助用户随时随地使用设备

在未来,我们还会看到什么样的技术呢?

比如XR 技术是一项很有意思的技术,可以给用户很多不一样的体验,尤其在线上游戏中会被经常用到,也可以帮助用户在任何时候任何地方使用任何的设备。分布式计算、分割渲染、VR 直播也是重要的应用领域。如果想要一个 360 度的视频,其中会有很多的数据,但是我不知道在我后面的是什么,如果我要快速地旋转,需要把我背后的这些数据都传过来,只有这样才能够使用户有 360 度的视角。依赖于 VR 视角的流媒体可以帮我们预测用户在接下来会有什么样的动作,提前把这些数据进行传输。

另一个方面是媒体传输技术。这里是基于 HTTP CDN 的流媒体,YouTube、爱奇艺、腾讯视频、苹果都在采用基于 HTTP CDN 的解决方案。HTTP CDN 要连接起来是非常简单的,客户端能够根据带宽获取质量最高的内容。很多信息或者数据都会被部署在 CDN 上面,由客户端来决定需要获取的内容,可以实时地根据客户端的带宽,直接去下载对应的资源或者内容。

媒体传输还有一种新的技术叫 CMAF,它是一种新的应用格式。内容的提供商对于相同的内容有很多不同的版本、不同的质量以及不同的加密方式,CMAF 可以为所有版本提供共同的格式,可以应用于一些基于 HTTP 的框架,比如 DASH 和 HLS,所以采用 CMAF 能够有相同的网络分发,去解决客户的需求。客户端可以是独立的,也可以采用支持 HLS 或 DASH 的网页浏览器。CMAF 是非常有意思的一种技术,因为可以支持 MSE,CMAF 可以由 MSE 的客户端来进行使用。如果大家对于 CMAF 的媒体传输感兴趣的话,下一个月会有专门的会议,时间大概是半天,我们会具体讨论 CMAF 的一些应用和部署。

5G 的停留和 6G 的展望

最后我想讲一讲 3GPP。一开始我们有移动电话 (1G,2G),之后我们有了流量数据(3G),有了 3G 之后我们可以通过手机上网,之后有了宽带(4G),我们小小的手机也可以观看或者发起直播。我们现在已经不仅仅用手机打电话了,而是用它上网。现在有了 5G,又有了新的生态系统,紧随其后的是上面接入了很多服务模块。我们不仅停留在 5G,还在展望 6G。

5G 现在在中国已经很流行了,中国很多的公司已经在讲 6G 了。那么 6G 到底是什么?6G 其实就是混合的模块,把我们的物理世界、虚拟世界以及数字世界结合起来,用户则是站在这几个不同世界的中间。这就是我的介绍,谢谢。

责任编辑:xj

原文标题:EmTech China现场直击丨小米技术委标准与新技术部音视频标准总监Mary-Luc Champel:小米模式是建立生态系统

文章出处:【微信公众号:DeepTech深科技】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 生态系统
    +关注

    关注

    0

    文章

    702

    浏览量

    20723
  • 小米
    +关注

    关注

    70

    文章

    14349

    浏览量

    144112

原文标题:EmTech China现场直击丨小米技术委标准与新技术部音视频标准总监Mary-Luc Champel:小米模式是建立生态系统

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AMS-WE100P无线延长器:让高清音视频传输无界限

    在追求高效与便捷的今天,高清音视频的无缝传输已成为我们日常生活和工作中不可或缺的一分。深圳市程达科技有限公司凭借其创新技术和深厚底蕴,推出了AMS-WE100P无线延长器,这款设备以其卓越的性能和广泛的应用场景,正逐步成为高清
    的头像 发表于 11-28 10:07 130次阅读

    AMS-HE120系列:4K HDMI音视频单网线延长器,引领传输技术新潮流

        随着科技的迅猛发展和人们生活品质的不断提升,高清音视频传输技术已经成为现代生活和工作中不可或缺的重要组成部分。在教育、商业、安防、家庭影院等多个领域,高清、稳定、便捷的音视频信号传输需求
    的头像 发表于 11-27 10:11 124次阅读
    AMS-HE120系列:4K HDMI<b class='flag-5'>音视频</b>单网线延长器,引领传输<b class='flag-5'>技术</b>新潮流

    AMS-HE200:HDMI音视频网络延长器,开启传输新时代

    在数字化时代,高清音视频传输已经成为各行各业不可或缺的重要技术。无论是安防监控、视频会议,还是户外广告、家庭影院,高清音视频信号的无缝传输都扮演着至关重要的角色。深圳市程达科技有限公司
    的头像 发表于 11-27 10:04 127次阅读
    AMS-HE200:HDMI<b class='flag-5'>音视频</b>网络延长器,开启传输新时代

    Amoonsky创新音视频连接技术:全新推出AMS-HE200 HDMI网线延长器

    简介: 在不断向高清多媒体体验迈进的世界中,强大的音视频连接需求变得前所未有的重要。AMS-HE200,Amoonsky开创性的HDMI网线延长器,成为重新定义音视频网络格局的解决方案。这款创新
    的头像 发表于 10-24 16:09 199次阅读
    Amoonsky创新<b class='flag-5'>音视频</b>连接<b class='flag-5'>技术</b>:全新推出AMS-HE200 HDMI网线延长器

    盘点那些常见音视频接口

    我们熟知的一些常见音视频接口,发展至今在日常使用中已经渐渐少了。但是在工业领域的音视频连接,依然能看到其身影。这些看似消失的接口,它们现在发展成什么样子了?本期我们将做一个大盘点。
    的头像 发表于 09-09 14:34 526次阅读

    常见音视频接口的静电浪涌防护和滤波方案

    音视频接口在现代多媒体设备中扮演着至关重要的角色,它们确保了音视频信号在不同设备间的顺畅传输,各种类型的音视频接口满足了多样化的应用场景需求。 在音视频接口的设计领域,静电浪涌防护与滤
    的头像 发表于 06-25 11:28 660次阅读

    音视频IP化浪潮全面来袭,分布式系统开创音视频行业新时代!

    在传统音视频频系统中,厂商们各自采用不同的通讯方式和控制协议,这使得不同的产品之间就像一座座的信息孤岛,要连接起来就需要复杂的转换设备和系统再开发。随着音视频项目的规模不断扩大,各类音频设备产品
    的头像 发表于 05-30 16:55 673次阅读

    音视频产品EMC整改案例解析

    音视频产品EMCRE整改案例解析
    的头像 发表于 05-20 16:49 415次阅读
    <b class='flag-5'>音视频</b>产品EMC整改案例解析

    【RTC程序设计:实时音视频权威指南】音视频的编解码压缩技术

    音视频所载有的信息在通过传输的时候就需要压缩编码。 其中,文本压缩是指通过使用各种算法和技术,将文本数据表示为更紧凑的形式,以减少存储空间。 霍夫曼编码是一种无损压缩算法,它可以根据字符出现
    发表于 04-28 21:04

    音视频SoC与AI技术融合,带来更智能的音视频处理解决方案

    ,如WiFi路由器和物联网设备。在安防、智能音频等领域,对SoC芯片的算力要求相比智能手机、服务器等略低。   人工智能技术音视频SoC 的融合                                          随着人工智能
    的头像 发表于 04-26 01:20 4385次阅读

    【RTC程序设计:实时音视频权威指南】音频采集与预处理

    闲暇之余,继续学习【RTC程序设计:实时音视频权威指南】这本书。 书中对于音频采集的介绍非常详细和全面,包括原理、方法、技术细节以及实践应用等方面的内容。 音频采集是实时音视频通信中的关键步骤之一
    发表于 04-25 10:41

    【RTC程序设计:实时音视频权威指南】计算机知识基础篇

    感谢论坛组织的学习活动,我们也已此篇未开始进入《实时音视频权威指南(rtc程序设计)》的世界。 实时通信在当今互联网时代是非常重要的一种技术,我们在进行微信的语
    发表于 04-23 09:02

    【RTC程序设计:实时音视频权威指南】新书一瞥

    本人从事音视频领域的开发,经常接触实时音视频处理相关的技术,看到这本书非常有兴趣阅读,这本书全面介绍实时音视频(RTC)技术的权威著作,该书
    发表于 04-22 09:09

    音视频解码生成:打造极致观影体验的关键技术

    在现代多媒体时代,音视频解码生成技术已成为提供极致观影体验的核心要素。它不仅能够确保音视频数据的高效传输,还能保证播放的流畅性和画质清晰度,为用户带来身临其境的观影享受。 1. 解码生成的重要性
    的头像 发表于 02-25 14:43 467次阅读

    音视频解码生成在多媒体制作中的应用

    音视频解码生成是多媒体制作中不可或缺的一分,它扮演着将编码的音视频数据转化为可播放、可编辑的内容的关键角色。在多媒体制作的全过程中,音视频解码生成
    的头像 发表于 02-21 14:39 376次阅读