0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Dav1d移动端解码高清视频达30FPS

LiveVideoStack 来源:NL 2019-05-09 11:48 次阅读

个人电脑

在x86方面,此版本主要改进了Dav1d的SSSE3性能。Jiang Xuefeng对亮度和Paeth帧内预测函数的色度预测做出了贡献,分别提高了0.8%和0.4%的全局性能。

Liwei Wang继续他的逆变换工作,针对更大的8x32,32x16和32x32以及高达64x64的块,提供了这个版本的最大速度优化,在一些视频上超过10%。

Dav1d0.3.0还新增了第一个SSE4.1程序集。在大多数情况下添加的SSE4.1指令除了SSSE3之外没有太多利用上,但Victorien Le Couviour - Tuffet近一个月还在优化SSE4。他对CDEF约束方向增强滤波器滤波器进行了优化,使模块级别的速度提高了115倍,整体提升了1.5%。

与此同时,Henrik Gramner编写了一些非常聪明的SSE2代码来加速熵解码/码流读取,刚开始会占用大部分解码时间,尤其是在AVX2指令上。汇编代码为所有64位x86平台带来了加速,AVX2约为4%、SSSE3和SSE4.1约提升2%。

总的来看,这些测试使得SSSE3上的Dav1d0.3.0快24%,SSE4.1快26%,AVX2 CPU快4%。

虽然单线程aomdec仍然非常强大,但是多线程Dav1d0.3.0使libaom在下面对比图中的位置更微小。

Arm64

MartinStorsjö提供了两个非常好的提交,使用NEON汇编代码加速了loopfilter(NEON环路过滤器)和自导环路恢复。这两项功能都加速了大约3倍,使性能提升了7%到36%。不仅可以实现更高的分辨率、帧率和码率,还可以降低相同画面内容的硬件功耗。

高通骁龙835上单核解码1080p视频突破25FPS,使用多个线程稳定30 FPS,某些内容甚至达到60FPS。

总结以上结果,我们看到《RED》的测试结果提升明显,因为它很大程度上依赖于loopfilter。单线程增益介于11%和36%之间(平均19%),多线程介于7%和16%之间。

应用现状

Dav1d的应用进行得非常顺利,重大新闻是Chrome浏览器和新的Microsoft Edge背后的开源项目Chromium现在也用了Dav1d,默认情况下将在Chrome 74中集成。

Firefox 67也在最新版本里使用了Dav1d,Dav1d已更新为0.2.1并使用了多线程。 除了Windows之外,默认情况下还在Linux和macOS上启用Dav1d解码。

FFmpeg和 VLC 自然也使用了Dav1d,一旦FFmpeg 4.2发布,Handbrake,自然也会考虑集成Dav1d。

Youtube越来越多的使用AV1编码,他们甚至编码了一些4K和8K分辨率高达60fps的视频,在这里了解如何让Youtube启用AV1。(https://www.youtube.com/testtube)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 高清视频
    +关注

    关注

    1

    文章

    66

    浏览量

    51645

原文标题:Dav1d移动端解码高清视频达30FPS

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于RK3588的8K视频解码显示案例分享!引领超高清工业视频时代

    RK3588工业核心板支持8K@60fps H.265、8K@30fps H.264视频硬件解码,支持8K@30fps H.265/H.26
    发表于 07-17 11:15

    在ARM上实现模拟视频的实时解码,模拟相机的速度为1080p 30fps,TVP5150能达到这个速度吗?

    最近需要在ARM上实现模拟视频的实时解码,模拟相机的速度为1080p 30fps, 我在这里想咨询一下TVP5150能达到这个速度吗
    发表于 12-20 07:57

    摄像头调试问题:在VGA 30fps时出现图像上下错位

    ` 具体情况是这样的摄像头模块是Micron的MT9V111,电路输入时钟是27MHz,寄存器配置为VGA(640*480)@30fps YUYV输出,出现图像上下错位,中间还有一条窄黑带(见图
    发表于 05-13 11:47

    华为海思HI3536开发板 H.265/H.264解码 HDMI2.0 4K输出 A17四核H.265

    处理器内核− ARM Cortex A17 四核@Max. 1.4GHz− ARM Cortex A7 单核@Max. 900MHz视频解码处理− 4x4K(3840*2160)@30fps
    发表于 03-26 12:56

    H.264视频解码FPGA解决方案

    决定,单核最大可以支持4K/30fps,1080P/120fps。可根据可用硬件资源和客户需求可提供帧率定制,如960P/120fps等。3.编解码延迟低在1080P/
    发表于 05-07 17:14

    用DM365 300Mhz跑1080P的图像,发现capture是30fps, 编码是22fps左右.图像有时候会跳帧, 请问是什么原因?

    本帖最后由 一只耳朵怪 于 2018-5-25 15:08 编辑 我想用 DM365 300Mhz 跑1080P的图像, 有点问题.,发现capture是30fps,编码是22fps左右.现在
    发表于 05-25 00:47

    DM368是否可以实现1080P/30fps视频信号的一入两出

    请教专家,DM368芯片是否可以实现1080P/30fps视频信号的一入两出,其中 “一入”是指接收摄像头输出的视频信号,其制式为1080P/30fps; “两出”是指将接收到的
    发表于 05-31 01:31

    请问有没有集成芯片,可以将1080P 60fps并行信号转为1080P 30fps并行信号

    请问有没有集成芯片,可以将1080P 60fps并行信号转为1080P 30fps并行信号,因为DM368最大处理能力是1080P 30fps,时钟频率最大为120MHZ。
    发表于 05-31 02:15

    dm368 编码 1080p达不到30fps的问题。

    60FPS (用过tvp7002 component,另外一颗采集芯片)。想编码出1080P 30FPS视频以及同时编码音频。 1,实际测试结果是
    发表于 06-21 01:47

    UP板上的D435没有达到30fps

    。如何在UPBoard上使用D435相机获得30fps的速度?以上来自于谷歌翻译以下为原文We have an UP Board, and a D435 camera. The D43
    发表于 11-16 11:22

    DM388能实现500兆像素30fps吗?

    Hi, 我们想要做一款鱼眼镜头IPC,分辨率要求最少500W,并且需要30fps,dm388可以搞定么?
    发表于 04-15 07:39

    基于原型验证系统的高清视频解码样例设计

    数字高清视频解码视频处理样例系统,是基于ARM公司的标准ARM11处理器,外接标准500Mega 高清sensor采集卡,SAAIF
    发表于 07-25 11:54 1254次阅读
    基于原型验证系统的<b class='flag-5'>高清</b><b class='flag-5'>视频</b>编<b class='flag-5'>解码</b>样例设计

    全新低成本达芬奇处理器推动便携式高清视频应用发展详细中文介绍

    D M 3 5 5 处理器由集成的视频处理子系统、MPEG-4-JPEG 协处理器(MJCP)、ARM926EJ-S 内核以及多种外设组成(见图1 )。MJCP 能够以720p格式与30fps
    发表于 04-23 09:26 7次下载
    全新低成本达芬奇处理器推动便携式<b class='flag-5'>高清</b><b class='flag-5'>视频</b>应用发展详细中文介绍

    NEON技术如何实现移动视频高效解码AV1?

    ARM的NEON技术,其基本原理是让处理器在每个时钟周期内完成更多工作。dav1d 0.3.1中,在解码1080p视频时,基于NEON开发的dav1d可以毫不费力地达到
    的头像 发表于 06-05 10:47 5522次阅读
    NEON技术如何实现<b class='flag-5'>移动</b>端<b class='flag-5'>视频</b>高效<b class='flag-5'>解码</b>AV<b class='flag-5'>1</b>?

    瑞芯微工业处理器8K视频解码+8K显示案例测试

    本案例使用GStreamer API通过ARM从本地导入8K视频文件(H.264编码格式或H.265编码格式),然后进行H.264或H.265(NV12)解码,将解码后的图像以30fps
    发表于 04-28 14:28 839次阅读
    瑞芯微工业处理器8K<b class='flag-5'>视频</b>编<b class='flag-5'>解码</b>+8K显示案例测试