随着对高清音频的兴趣持续攀升,对具有高级功能的高清 TWS 耳机的巨大需求正在达到顶峰。本文介绍了高清音乐传输背后的技术,以及音频设计师如何满足日益增长的需求。
行业专家注意到对高清音频无线耳机的需求稳步增长。随着各个年龄段的人(包括与年龄相关的听力下降的人)寻求全高清声音体验,研究还指出,对听觉个性化的需求不断增加,以弥合音频和听觉之间的差距。这些趋势正在推动音乐传输链各个阶段的高清音频支持的发展。
高清音频的演变
术语高清音频(或高分辨率音频)没有严格的技术定义。它通常用于描述支持比此类设备采用早期可用的更高数据速率的音频系统。该术语最初用于描述可以支持比光盘 (CD) 标准更高的数据速率的数字音频系统。这包括替代磁盘格式,以及后来包含数字音频记录的文件。它也被应用于音频流,最近被应用于能够提供比典型音频质量更好的无线耳机。
音频录制和分发方面的改进提高了移动收听者可用的数据速率。由于蓝牙限制,无线耳机落后。然而,较新的蓝牙编解码器使无线耳机能够提供高清音频。这对包括驱动程序在内的音频硬件提出了新的要求。本文将解释与高清音频相关的技术术语,描述从音源到耳机的音频链的改进,以及如何使用平衡电枢 (BA) 高音扬声器和动态低音扬声器结合 ANC、减少遮挡、和听力个性化。
技术背景
数字音频格式最简单地用它们的采样率和位深度来描述。数字音频通过及时快速采样信号幅度来表示模拟声音。测量每个样本的幅度并保存为二进制数。每秒的样本数就是采样率。用来描述幅度的二进制数的大小就是位深度。
采样率
图 1:数字音频中的采样率和位深度。
归功于奈奎斯特(以及香农和惠特克)的信息论指出,我们必须每个周期至少对正弦波进行两次采样,以准确捕获其信息。否则,重建的输出将是错误频率处的混叠,如图 2a 、 3和 2b 所示。别名是以“Nyquest 频率”(采样率的 1/2)为轴的频域镜像。
对于音乐,采样率必须至少是要再现的最高频率的 2 倍。因此,如果要表示的最大音频频率为 20 kHz,则需要 40 kHz 的采样率。这需要在 ADC 上使用非常锐利的 20 kHz 低通滤波器。任何通过滤波器的 20 kHz 以上的音频在转换回模拟时都将被重新创建为可听见的别名,从而降低音乐的保真度。因为没有一个滤波器是完美的,所以在现实世界的实践中,在要表示的最高频率和采样限制之间提供了一些余量。在光盘格式中,要采样的音频经过低通滤波到 20 kHz。采样率设置为 44.1 kHz,略高于 40 kHz 的理论极限,以提供滤波器余量。
图 2a 和 2b:时域和频域中的别名
位深
用于描述样本的词的大小或位深度决定了每个样本被数字化的准确程度。想象一下通过四舍五入来描述一个人的身高。然后你可以说某人有两三米高。第二个数字会更好,可以将某人描述为 2.1 或 2.2 米高。这仍然有点粗糙,但可以继续添加数字,直到提供足够的分辨率。
数字音频也是如此。每次在二进制字中使用一个附加位时,可以用两倍数量的值来描述幅度。这反过来又将误差减少了两倍。虽然人们会直观地认为四舍五入会导致失真,但事实证明,通过应用一点点称为抖动的噪声,误差(量化误差)可以从失真转换为噪声。因此,一个好的录音系统没有失真,并且每增加一位深度,本底噪声就会下降 6 dB。最响亮的未失真声音与本底噪声之间的比率为 6 * 位深度。
由于数字系统是建立在 8 位的倍数之上的,因此数字音频使用 8 位的倍数来表示其字长。非常早期的计算机音频仅使用 8 位。将本底噪声仅比最响亮的音乐低 48 分贝并不是很实用。光盘支持 16 位深度,提供 96 dB 的信噪比。这涵盖了一个非常有用的范围。如果将播放音量设置为合理的水平,则歌曲之间剩余的嘶嘶声低于聆听环境中的背景声音。随着音量的提高,歌曲之间或安静的段落中可能会出现一些可听见的嘶嘶声。因此,可以提出使用更高位深度来减少总系统噪声的该分量的论据。
图 3:增加采样率和位深度的影响
压缩
光盘的组合比特率为 16 比特/样本 ∙ 44,100 样本/秒 ∙ 2 个通道 = 1,411 千比特/秒 (kbps)。这种数据速率太大,无法用于早期的数字音频播放器。下载歌曲花费的时间太长,可用内存有限。为了解决这个问题,开发了压缩方法。模式识别可用于对数据流中的 1 和 0 的模式提供更简洁的描述。这就是在计算机中压缩数据文件的想法。一些文件可以压缩到小于原始大小的 1/10,然后在以后恢复而不会丢失。
使用这些方法无法大量压缩音乐文件。通过使用线性预测算法,可以获得一些改进。然而,压缩比仍然很少超过 2:1。由于没有数据丢失,这些被称为无损编码器。两个流行的例子是 FLAC 和 Apple 无损压缩。
为了进一步降低数据速率,可以使用人类听觉的心理声学模型来最小化丢弃数据的可听度。一种声音隐藏另一种声音以防止人类感知是很常见的。(见图 4。)4通过以较低的速率对隐藏的声音进行编码或完全丢弃它们,可以降低整体数据速率。虽然心理声学压缩方法有所改进,但即使是设计最好的编码器仍会导致一些可听伪影5。较低的压缩率会以更大的文件和更高的数据速率为代价提供更少和更温和的声音伪像。这是高清音频流运动背后的科学,通过以更高速度传输音乐的能力成为可能。
扩展带宽
“高清音频”和“高分辨率音频”这两个术语经常作为同义词使用,但这可能会导致混淆。“高清音频”用于描述具有比传统使用更高数据速率的任何音频。日本音频协会 (JAS) 授权将“Hi-Res Audio”标志用于满足特定要求的硬件,包括能够再现高达 40 kHz 的音频。(确切的要求可以从 JAS 获得许可)。
图 4:图 4:响亮的声音掩蔽对具有相似频率的较安静声音的感知
高清音频是增加采样率、增加位的任意组合的结果 图 3. 增加采样率和位深度的效果。图 4. 响亮的声音掩盖了具有相似频率的较安静声音的感知。TWS 耳机/WP07 4 深度中的高清音频,并降低压缩率。如果采样率增加到超过 44.1 kHz,数字化音频将更接近原始信号,这反过来有助于在整个传输链中保持保真度。将带宽扩展到 20 kHz 以上也成为可能。并非所有高清音频格式和设备都具有超过 20 kHz 的带宽,但有些有,尤其是那些以 JAS 认证为目标的设备。
音乐传播链
为了让听众听到高清音频,管道中的每一步都必须具有足够的质量。其中包括原始歌曲准备过程、下载或流媒体服务、播放系统、耳机连接以及耳机驱动程序。
记录和交付
音乐录音设备广泛可用,允许以各种采样率和位深度进行存储,其中许多超过了光盘规格。一旦音乐被记录下来,它就必须交付给用户。文件下载服务支持高清音频已有一段时间了。最近,大多数流行的流媒体服务已经宣布或已经提供无损 CD 质量作为基准,并且它们的库中越来越多的具有高比特率高清的子集,通常不收取额外费用。
音乐播放硬件
今天,人们可以使用各种设备(包括专用音乐播放器、手机、PC 等)收听下载或流式传输的音频。高清音频播放在这些设备中广泛可用。支持高清音频的额外成本相对较低,通常支持高达 192 kHz 的采样率和高达 32 位的字长。在某些情况下,这些设备(如果有的话)的模拟耳机输出被限制在 20 kHz,并且通常不具有超过 16 位的噪声性能。但是,在这些情况下,可以将外部 DAC 插入数字端口以获得更高的性能。
耳机编解码器
链条的最后一步是耳机。在无线耳机中,一个关键的限制因素是蓝牙无线电链路。蓝牙编解码器 (COder/DECoder) 在传输到耳机之前会降低数据速率。为了满足无线耳机和 TWS 中对优质音频日益增长的需求,已经引入了具有更高数据速率的编解码器。(表 1。)在设计合理的耳机中,这些较新的编解码器可以提供更高保真度的聆听体验,即使不是完全无损。更进一步,高通最近宣布他们打算支持通过蓝牙无损传输 CD 质量的音频。6
一些新的高清蓝牙编解码器支持扩展带宽。然后耳机可以再现 20 kHz 以上的频率。图 5 显示了市售 TWS 耳机的响应曲线测量。高达 40 kHz 的显着输出可见。
表 1:CD 标准和常用蓝牙编解码器表 1:CD 标准和常用蓝牙编解码器
图5:漫步者Neobuds Pro TWS带宽对比
高清TWS耳机音频设计
购买 HD TWS 耳机的客户对音频的期望值非常高。由于整体功能集和驱动系统可用的空间有限,声学设计在 TWS 耳机中尤其具有挑战性。TWS 耳机必须舒适地贴合耳朵,并且必须越来越多地提供 ANC 和其他高级功能。这给声学设计师带来了独特的挑战。
ANC 和高清音频的需求之间的交互尤为重要。为了在嘈杂的环境中提供有效的 ANC,驱动器必须支持低失真的高低音输出。用于减少遮挡的泄漏或半开放式设计对低音输出提出了更高的要求。同时,高清音频播放需要将高音输出扩展至 20kHz 甚至更高,尤其是在寻求 JAS Hi-Res Audio Wireless 认证的情况下。随着扬声器尺寸的减小,使用单个动态扬声器同时满足这两个要求变得越来越困难。然而,现代 TWS 设计的目标是小巧、舒适的外形。
图 6:Knowles ref 的频率响应。设计混合
为了满足这些看似矛盾的需求,许多耳机使用单独的动态低音扬声器和 BA 高音扬声器来代替单个全频驱动器。这种混合配置提供了更平滑和更扩展的高频响应,同时减少了对可增加功耗和减少动态余量的电子均衡的需求。低音扬声器设计专注于为音乐、ANC 和减少遮挡提供强劲的低音,而 BA 高音扬声器经过优化,可再现清晰独特的高音以支持高清播放。
BA 高音扬声器还支持以低功耗驱动高高音增益,使其成为提供听觉个性化的耳机的理想选择。当启用个性化时,它们的密封、封闭式设计限制了对麦克风的声学反馈的可能性。为了满足这些看似矛盾的需求,许多耳机使用单独的动态低音扬声器和 BA 高音扬声器来代替单个全频驱动器。这种混合配置提供了更平滑和更扩展的高频响应,同时减少了对可增加功耗和减少动态余量的电子均衡的需求。低音扬声器设计专注于为音乐、ANC 和减少遮挡提供强劲的低音,而 BA 高音扬声器经过优化,可再现清晰独特的高音以支持高清播放。
这样的设计还为驱动器的布置提供了更大的自由度。它可以将低音扬声器移动到与耳塞不太直接对齐的位置或角度,同时仍将 BA 高音扬声器保持在开口附近,以最大限度地减少高音扬声器和耳塞之间滞留的空气惯性。耳机整体形状更加灵活,可实现最大的高音延伸,在不损失高频性能的情况下提高用户舒适度。
使用 BA 高音扬声器可提供多种工具来调整高频响应。可以对高音扬声器开口附近的声学特征进行整形以进一步细化高频输出。可以调整分频器以平滑混合低音扬声器和高音扬声器信号。可以通过选择更高或更低的线圈阻抗来调整高音扬声器的灵敏度,以更好地匹配低音扬声器。最终整形可以通过 DSP 调谐来完成。BA 高音扬声器的高扩展输出最大限度地减少了增加高音增益以产生所需基线响应的需要。
图 7:Knowles RAN 高音扬声器与典型 8 毫米动圈扬声器相比的高音响应。高音扬声器提供的额外动态余量减少了增加高音增益的需要,尤其是在个性化音频时
每个驱动器都可以由自己的放大器驱动,从而在塑造响应方面更加灵活。Bowers & Wilkins PI7 7和 Edifier Neobuds Pro 8是使用独立放大器和有源分频器的 TWS 耳机的两个示例。
还可以使用高音扬声器提供远高于 20 kHz 的响应。图 7 将 Knowles BA 高音扬声器模型 RAN 的高音输出与典型的 8 毫米动态扬声器进行了比较。BA 高音扬声器提供了高清音频所需的更高的高音输出和扩展,包括支持听觉个性化或增强的能力。
结论
消费者对 TWS 耳塞的高清音频质量要求越来越高。向听众交付高清需要升级交付链中的所有阶段。音乐流媒体服务、手机和蓝牙编解码器能够提供比以往更高的保真度。现在是 TWS 耳机设计师充分利用这些变化来满足消费者需求的时候了。为此,还必须密切关注驱动系统。带有动态低音扬声器和 BA 高音扬声器的混合驱动器是高清音频 TWS 耳机的最佳解决方案。
审核编辑:郭婷
评论
查看更多