0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于频域处理法实现数字音频的变调功能

电子设计 来源:电声技术 作者:李力利 2021-03-16 14:35 次阅读

1 引言

改变声音信号的音调是许多商用设备的一种功能,最典型的应属卡拉OK机了。由于发音音调高低因人而异,人们希望伴奏音乐的音调适合自己的嗓音,因此卡拉OK机中设计了专门的硬件来实现这一功能。例如雅马哈公司的用于数字变调的大规摸集成电路 YSS222D和YSS216B,内部集成了A/D,D/A和数字信号处理器,利用采样和重放数据时速度的不同来实现变调。功能,重放比采样速度快则升调,反之则降调。另外,为了使播放时间不变,还需对数据段进行复制或删除。由于商业保密的需要,具体算法未公开,据可询资料实现的系统,不能有效解决因复制或删除数据带来的相位不连续问题。

当前,声卡已成为计算机的基本配置,但无变调功能,为弥补这一缺憾,可以采用件的方法对声音文件重新编码,使声卡回放时音调改变。另外,数字音频工作站也需要软件实现变调功能。因此讨论了3种软件实现算法,围绕着如何变调而不变时间,以及如何解决相位不连接问题,从变调原理着手,讨论了时域实现的理论依据,最后找到了一种有效的变调方法-- 频域处理法,实验证实效果良好。

2 变调的乐理基础

声音是由物体振动产生的,声音的基本要素有:音调、音强和音色。乐音体系根据振动频率即音调的不同,将乐音分成音级,基本音级广泛采用CDEFGAB这8个字母命名,某音级与往上数8个音级之间的距离称为“纯八度”,世界上普遍采用的12平均律将一个纯八度分成12个均等的半音,相邻两个半音间的物理振动频率相差21/12倍,也就是说各半音间的振动频率成等比关系,一个纯八度频率相差2倍。

如果将信号中的所有频率成分升高或降低21/12倍,就能使音调升高或降低一个半音。假设原信号频率为f,变调后频率为f,二者的关系应该满足

f=fx2d/12, d=±1 ,±2,±3 (1)

当d》0时,升调,反之,降调;d每变化1,音调升高或降低一个半音。

3 时域实现的依据及存在的问题

一种实现变调的作法,是采用硬件实现相似的办法,即改变WAV文件头中有关采样率的信息。如果采样率提高,则声卡回放速度加快,产生升调的效果,同时回放时间变短;反之,产生降调的效果,回放时间变长。为保持时间不变,以帧为单位,利用信号的短时周期性,升调时将帧内后部数据段复制,降调时将帧内后部数据段删除,图1画出了一帧的数据处理情况。可以看到,若是升调,帧间数据是连续的,但由于数据段的复制,帧内数据段间相位不连续;若是降调,帧内数据连续,但帧间数据相位不连续,因此声音质量必然受到影响,产生喀嚓声。

另一种方法是,采用时域抽选和内插[4]。下面分析抽选和内插的频谱,看如何实现变调。抽选表示成下式

Xd[n]=[nM] (2)

表示每M个采样值选1个,其余M-1个舍弃,则信号长度缩短为1/M。抽选后信号频谱和原信号频谱间的关系为

1 M-1

Xd(ejω)=-Σ X[ej(ω/M-2πi/M (3)

M i=0

图2所示粗线为M=2的抽选信号频谱,粗实线为M=2的抽选信号频谱,可以看出,抽选后信号的频率成分均为原来的2倍,所以能实现升调。为防止抽选后频谱混叠,抽选前必须作抗混叠数字低通滤波,截止频率为π/M。

再看看内插的频谱变化。内插时域表示成

Xi[n]={x[n/L,n=O,±L,+2L,+3L, 。.. (4)

0, 其它

表示每两个采样值中插入L-1个零,整个信号长度增加为L倍。内插后信号频谱和原信号频谱间的关系为

Xi(ejω)=X(ejLω) (5)

图2虚线所示为L=2的内插信号频谱,可以看出,所有频率成分均为原信号的1/2,所以能实现降调。为不产生镜像频率成分,内插后必须作反镜像数字低通滤波,截止频率π/L,也可用线性内插取代插零,而无须反镜像滤波。

抽选和内插后的数据量同样会变短或变长,下面来推导保持数据量不变的具体实现方法。根据上述抽选和内插的频谱变化情况,反推时域变化过程:若将信号作快速离散傅里叶变换(FFT),将谱线沿频率轴扩张或收缩,再作反变换(IFFT),得到的信号应该是被升调或降调,并且数据量保持不变。

非整数倍的变调可由抽选和内插结合实现,同样可以采用数据段的复制或删除的办法保持数据量即回放时间不变,其系统结构如图3所示。但对于复制或删除数据后段间相位的不连续性问题,有些资料[3]提出找出信号的基音周期,以基音周期为复制或删除单位,并帧间重叠处理,也不能从根本上解决相位问题。

4 频域实现的算法研究

现在考虑采用频域实现来解决相位问题。

首先采用频谱伸展的办法得到升调的信号,如图4所示,(a)为原始信号波形及FFT的幅度和相位图,(b)为将原始信号的FFT谱线向高频伸展一倍,中间内插零,再IFFT得到信号波形及FFT幅度和相位图,情况和时域抽选一样。然后考虑将频谱伸展过程中的谱线内插零改成线性内插,如(c)所示,可见信号波形段间能很好地吻合,但波形失真较大。最终发现结合插零和线性内插,低频插零,高频线性内插,既能保证波形失真较小又能在两段相连处较好地过滤,如(d)所示。

对于降调,图5(a)是2帧原始信号波形及后一帧的FFT幅度图,图5(b)采用FFT谱线向低频收缩,再IFFI,得到的波形和时域内插法一样,改进措施见图5(c),被处理的连续两帧信号间有一部分重叠,得到的两帧信号波形便能很好地过渡。

因此,要实现式(1)任意倍频率的变调,令α=2d/A2,采用以下公式。为简单起见,低频高频均线性内插:

X[K]=FFT[x(n)], k=0,1,。..N-1 (6)

y[n]=IFFT[Y(K)],n=0,1,。..N-1 (8)

其中N是帧长,int()表示取整,min()表示取较小值。注意,仅仅对于降调a

另外帧长,即被处理的数据长度也必须适当,如果太短,会造成数据的复制和删除太过频繁;过长,又不符合短时周期性,明显地感到声音的多次重复或被打断。经过实验表明,帧长取4000点左右比较合适,对于采样率44.1 kHz的音频信号是0.1 s的数据量,4 000点的FFT使频谱取样间隔为10Hz左右。

5 结束语

实现变调的基本原理是改变信号的频率成分,可以通过时域抽选或内插实现,但为保持时间不变,每帧要复制或删除部分数据段,由此带来相位不连续从而影响声音质量。文中提出的频域法,根据变调的原理,将FFT谱线向高频或低频搬移,再作IFFT得到时域信号,若升调谱线搬移过程中采用线性内插,降调采用时域帧间重叠,能消除数据段的不连续问题,改善变调后的声音质量。频域实现无须低通抗混叠滤波或低通反镜像滤波,且FFT是快速算法,假设采用如ADSP2181或TMS320C54X,乘法运算占用单指令周期的DSP芯片,运算量小于1 MIps,实时运算不成问题。可见,频域法是一种有效可行的办法。

责任编辑:gt

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19291

    浏览量

    229903
  • 集成电路
    +关注

    关注

    5388

    文章

    11549

    浏览量

    361897
  • 计算机
    +关注

    关注

    19

    文章

    7496

    浏览量

    88000
收藏 人收藏

    评论

    相关推荐

    数字音频输入接口电路

     数字音频输入接口电路 AES/EBU解码器和解复用器AES/EBU解码器将双相标志码串行AES/EBU数字音频信号转换为信号数据流,再将两声道的音频数据信号分开,产生两路并行比特
    发表于 08-01 08:21

    数字音频接口的优势是什么

    数字音频接口的优势模拟耳机插孔的其他选择使用USB的数字音频
    发表于 03-09 07:35

    面向高清电视的全数字音频系统的设计

    随着数字录音和传输的出现,将数字信号源与数字处理直接结合起来提供端到端数字音频系统的想法看起来即将实现。端到端
    发表于 12-02 16:35 23次下载

    数字音频监测系统设计及应用

    【摘要】本文针对数字音频广播监测这一领域现状和需要解决的问题,介绍了音频监测中的关键技术。并且以目前国内较为先进的AudioAres数字音频检测系统为例介绍了多路数字音频
    发表于 07-07 13:54 13次下载

    数字音频编码技术

    内容• 数字音频编码技术基础• 数字音频编码技术标准• DRA音频编码技术及应用• 数字音频编码技术最新进展
    发表于 08-31 17:25 27次下载

    一种基于SOLA的数字音频变调算法及其在TMS320C671

    摘要:数字变调数字音处理的一种重要应用。描述了一种基于时域的内插和抽取技术实现音频
    发表于 09-01 20:28 45次下载

    数字音频编辑技术

        能够根据教学需要录制数字音频     能够利用软件编辑数字音频     能够根据需要输出相应格式的
    发表于 09-13 16:01 31次下载

    数字音频监视器

    泰克764数字音频监视器是现代数字音频应用系统中的先进监视仪器。它可用于数字音频的节目制作和质量检验。764综合了相位表和电平表的特点,并将这一特点用于数字音频数据监
    发表于 12-19 23:56 41次下载

    什么是DAB/数字音频广播

    什么是DAB/数字音频广播     DAB是数字音频广播(Digital Audio Broadcasting)的英文缩写。DAB是继调幅(AM)、调频(FM)广播
    发表于 01-28 16:47 2236次阅读

    什么是数字音频

    什么是数字音频 大家知道,无论现在的多媒体电脑功能如何强大,其内部也只能处理数字信息。而我们听到的声音都是模拟信号,怎
    发表于 02-02 11:50 4176次阅读

    什么是数字音频会议系统?

    什么是数字音频会议系统?   数字音频会议系统是针对模拟音频会议系统而产生的。   数字音频会议
    发表于 02-21 11:03 1064次阅读

    面向高清电视的全数字音频系统

    随着数字录音和传输的出现,将数字信号源与数字处理直接结合起来提供端到端数字音频系统的想法看起来即将实现。端到端
    发表于 07-16 09:28 1553次阅读
    面向高清电视的全<b class='flag-5'>数字音频</b>系统

    数字音频应用解析

    数字音频是一种利用数字化手段对声音进行录制、存放、编辑、压缩或播放的技术,它是随着数字数字音频处理技术、计算机技术、多媒体技术的发展而形
    发表于 11-01 15:53 6836次阅读

    数字音频技术的应用与发展

    (ADC)转换为数字信号,再通过数字信号处理技术进行处理和存储的一种音频技术。数字音频具有高保真
    的头像 发表于 07-13 10:14 2132次阅读

    电视数字音频输出是什么接口

    。 1. 数字音频输出的基本原理 数字音频输出利用数字信号处理技术,将音频信号转换为数字数据流。
    的头像 发表于 09-24 10:40 2363次阅读