0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智能多媒体服务 Dora,让用户获得更好的音视频体验

话说科技 来源:话说科技 作者:话说科技 2022-03-23 16:54 次阅读

视频刷了一条一条叕亿条,在「根本停不下」的过程中,你有没有想过这样一个问题:为什么不同的UP主,不同的视频,不同的设备,不同的环境,呈现出的音量却是相同的?原本高低起伏的音量,是如何被摆平的呢?

七牛云智能多媒体服务 Dora,可以给你答案。「解」字先写好,我们具体情况具体分析。

响度归一化:解决不同文件的音量问题

不同类型的UP主,会选择不同的收声设备。探店博主钟意方便灵活的小蜜蜂,音乐人最爱录音室话筒,就算是群众基础最为广泛的手机直录,收声情况也会因为手机的不同而不同。如果平台对各个音频、视频的音量不进行统一调整,每播放一条内容,用户就需要调整一次音量,用户体验大幅下降。

poYBAGI64DqAa0F1AAMpQrIiPBc615.png

例如以下示例视频中,三段音频响度依次变大,其响度值分别为-30LUFS、-23LUFS、 -17LUFS;如果不进行音量调整,收听过程中,看一条按一次音量键进行手工调音,就在所难免了。

pYYBAGI64DuAQ8klAAOJSh2RfXc949.png

为了让这三个不同响度的听感达到一致,七牛云智能多媒体服务Dora 提供强大的「响度归一化」功能。在示例视频的后半段可以看到,将三个音频响度归一化到 -20LUFS 后的音频与波形图。原本三个响度大小不同的文件,经过响度归一化的处理后,响度统一,收听过程中也不需要手动调节响度了。

应用案例

某音频平台作为国内广受欢迎的移动有声阅读应用,提供免费听书、听电台、听新闻等有声数字收听服务,用户规模上亿。平台拥有五千余名优秀声音主播与七万多档节目,文学名著、曲艺戏曲、外语学习、搞笑段子等十几个大类高清有声阅读资源,每天都有新的资源更新发布。

为了让内容更成体系,增强品牌效应,平台提供了音频片头功能。但是统一的音频片头遇上音量大小不尽相同的内容,直接拼接会显得很生硬,观众的听感、用户体验也会受到影响。通过七牛云智能多媒体服务 Dora 的「响度归一化」功能,让平台的音频节目浑然一体,自然流畅。

动态音频标准化:调整单一文件的音量问题

poYBAGI64DyAVvgUAALiRTXseis652.png

不仅不同博主上传的视频、音频文件会有响度参差的问题,就算是连续录制的同一条视频、音频中,声音也会有忽大忽小的现象。离麦克风的远近,收声场景的变化,甚至是录制中大笑、鸣笛、环境音的乱入,都会让听感大打折扣。

pYYBAGI64D-AHNXbAAM5opPlP28453.png

七牛云智能多媒体服务Dora的「动态音频标准化」功能,能够使视频、音频中音量大小统一。如示例视频中,前半部声音较小而后半部分声音较大,在波形图中也可以看出这样的情况。经过动态音频标准化处理后,从波形图可以直观看出,整条内容音量统一,实际听感也变得平和自然。

应用案例

作为国内知名的知识付费与内容变现技术服务商,某平台提供可零门槛搭建的专属知识店铺,帮助用户快速形成知识付费一站式解决方案。

视频质量直接影响着教学质量,而所谓「听课」,声音在其中的表现更是起着决定作用。通过七牛云智能多媒体服务 Dora「动态音频标准化」功能,尽可能减少录制环境对音频质量的影响,让课程的录制过程有了更大的宽容度。这不仅让线上的每一堂课音频和谐自然,也保障了不同知识店铺中的课程都有着相同的响度听感,提升了用户体验。

七牛云智能多媒体服务Dora的「响度归一化」和「动态音频标准化」两项功能,可以广泛应用于各0类音频、视频平台,包括有声书、播客、视频等场景。

和谐的听感背后,有技术的力量默默摆平音量的不和谐。七牛云智能多媒体服务Dora, 作为零运维、高可用、高性能的多媒体数据处理服务,在多媒体处理领域还有着更多的「解题方法」,让用户获得更好的音视频体验。

审核编辑:符乾江

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 多媒体
    +关注

    关注

    0

    文章

    494

    浏览量

    36927
  • 音视频
    +关注

    关注

    4

    文章

    462

    浏览量

    29843
收藏 人收藏

    评论

    相关推荐

    盘点那些常见音视频接口

    我们熟知的一些常见音视频接口,发展至今在日常使用中已经渐渐少了。但是在工业领域的音视频连接,依然能看到其身影。这些看似消失的接口,它们现在发展成什么样子了?本期我们将做一个大盘点。
    的头像 发表于 09-09 14:34 429次阅读

    常见音视频接口的静电浪涌防护和滤波方案

    音视频接口在现代多媒体设备中扮演着至关重要的角色,它们确保了音视频信号在不同设备间的顺畅传输,各种类型的音视频接口满足了多样化的应用场景需求。 在
    的头像 发表于 06-25 11:28 586次阅读

    音视频产品EMC整改案例解析

    音视频产品EMCRE整改案例解析
    的头像 发表于 05-20 16:49 356次阅读
    <b class='flag-5'>音视频</b>产品EMC整改案例解析

    高清HDMI转USB 3.0音视频多功能音采集卡-测评

    LCC380的设计理念在于全面考虑到各种用户场景下的需求。为了实现高品质的音视频采集效果,卡体搭载了业界领先的音频处理器解决方案。无论您是热衷于游戏直播、视频会议还是其他音视频应用,都
    的头像 发表于 05-14 17:45 744次阅读
    高清HDMI转USB 3.0<b class='flag-5'>音视频</b>多功能音采集卡-测评

    分享一款高清HDMI音视频采集编码卡,支持双码流

    “灵卡CAS”系列HDMI音视频采集卡。独具匠心的设计与功能配置,适用于各种规模的商务会议、多媒体教育以及数字化展示等各类场景。
    的头像 发表于 05-07 11:43 333次阅读
    分享一款高清HDMI<b class='flag-5'>音视频</b>采集编码卡,支持双码流

    【RTC程序设计:实时音视频权威指南】音视频的编解码压缩技术

    音视频所载有的信息在通过传输的时候就需要压缩编码。 其中,文本压缩是指通过使用各种算法和技术,将文本数据表示为更紧凑的形式,以减少存储空间。 霍夫曼编码是一种无损压缩算法,它可以根据字符出现
    发表于 04-28 21:04

    音视频SoC与AI技术融合,带来更智能音视频处理解决方案

    ,如WiFi路由器和物联网设备。在安防、智能音频等领域,对SoC芯片的算力要求相比智能手机、服务器等略低。   人工智能技术与音视频SoC
    的头像 发表于 04-26 01:20 4151次阅读

    【RTC程序设计:实时音视频权威指南】新书一瞥

    本人从事音视频领域的开发,经常接触实时音视频处理相关的技术,看到这本书非常有兴趣阅读,这本书全面介绍实时音视频(RTC)技术的权威著作,该书详细讲解了RTC的基本概念、技术原理、系统设计以及实际
    发表于 04-22 09:09

    音视频解码生成:打造你的专属高清影院体验

    在数字化时代,人们对观影体验的要求越来越高。音视频解码生成技术,作为现代多媒体播放的核心,正是为了满足这种需求而不断发展和完善的。通过这项技术,我们可以轻松打造属于自己的高清影院体验。 一、高清画质
    的头像 发表于 02-25 14:47 373次阅读

    音视频解码生成:打造极致观影体验的关键技术

    在现代多媒体时代,音视频解码生成技术已成为提供极致观影体验的核心要素。它不仅能够确保音视频数据的高效传输,还能保证播放的流畅性和画质清晰度,为用户带来身临其境的观影享受。 1. 解码生
    的头像 发表于 02-25 14:43 426次阅读

    音视频解码器优化技巧:提升播放体验的关键步骤

    随着数字多媒体内容的爆炸式增长,音视频解码器在现代技术生活中扮演着至关重要的角色。从流畅的在线视频流播放到高质量的本地文件解码,解码器的性能直接影响了我们的观看体验。那么,如何优化音视频
    的头像 发表于 02-21 14:45 727次阅读

    音视频解码生成在多媒体制作中的应用

    音视频解码生成是多媒体制作中不可或缺的一部分,它扮演着将编码的音视频数据转化为可播放、可编辑的内容的关键角色。在多媒体制作的全过程中,音视频
    的头像 发表于 02-21 14:39 345次阅读

    音视频解码生成与流媒体传输的结合

    音视频解码生成与流媒体传输是现代数字媒体技术中两个不可或缺的部分,它们的结合为用户提供了高质量、实时性的多媒体体验。 1. 解码生成与流
    的头像 发表于 02-21 14:36 355次阅读

    万兴科技发布国内首个音视频多媒体大模型“天幕”

    万兴科技近日正式发布了国内首个音视频多媒体大模型——万兴“天幕”,并宣布大模型研发中心将正式落户马栏山。
    的头像 发表于 02-04 11:42 1222次阅读

    音视频

    音视频技术都喜欢深究内部最核心的原理和机制,尤其是ffmpeg这个编解码库,可以说是音视频领域事实上的标准。语音智能算法,语言语义分析和理解,流媒体
    发表于 11-23 08:51