这篇文章来源于DevicePlus.com英语网站的翻译稿。
在本教程中,我们将分析语音信号。我们人类发出的声波是连续的模拟信号,然而对于信号处理,我们需要一个非连续时间模型——计算机的数字模型。本文的主要目的是帮助大家了解如何实现数字信号处理。我们将会比较自己录制的声音和一个失真信号,从中寻找2个语音信号之间的相似点和不同点。
对于这个项目,有一点比较重要:我们应该在应用不同的参数时,着重了解波形模式以及它们如何随时间变化。在本文(第1部分)中,我们将探讨语音信号的一些特性以及如何使用MATLAB处理这种信号;然后,我们使用Arduino对录制的语音信号进行详细分析。
软件
Audacity
Matlab
Arduino IDE
第1步:关于语音信号
处理语音信号时,我们要了解“信号”的含义,这一点很重要。那信号是什么?
通信信号处理 ,作者Paolo Prandoni与Martin Vetterli:
“信号”是对随时间或空间演变的现象的一种形式描述;通过信号处理,我们可以描述任何手动或“机械”操作,从而修改、分析或操控一个信号中包含的信息。我们举个环境温度的简单例子:我们就这个物理变量的正式模型达成一致——比如摄氏度——之后,我们可以用各种方式记录温度随时间的变化,而结果数据集就代表一个温度“信号”。
第一步,我们将了解语音信号的属性。录制自己的声音之前,让我们首先在Audacity中了解一些不同的参数。
声道数量:
单声道:您使用一个声道进行录音,这意味着只有一个音频信号——录音分布在同一音量级别。因此如果您有两个或更多扬声器,您听不出差异。这是最常用的方法,因为声音是用一个麦克风录制的,这意味着单声道占用的带宽较少,因此对许多应用(比如电话和无线电)来说非常有用。对于不太熟悉音频设备放置技术细节的用户来说,单声道是正确的选择。
图1:单个音频信号在同一音量级别上分配给多个扬声器(单声道)
立体声:您用两个或更多声道录音。由于信号来自多个信号源,因此能够描述声音的方向和位置。使用立体声设置意味着您需要将至少2个麦克风放置在适当的位置。通过这种方式,您可以确定多个声源的不同位置。这种录制通常用于电影和音乐,以获得更广泛的声场解析。
图2:两个或多个信号通道分配到扬声器(立体声)
项目速率(采样率):在一秒内对连续时间信号的采样次数,然后将其转换为离散时间信号(数值)。采样的度量单位是S/s(即每秒采样数)。
由于音频信号是模拟信号,我们需要将其转换为数字信号,以便由计算机进行处理。我们可以使用下面的采样定理完成此操作。
我们假设有一个模拟信号,如下图所示。想象一下,您需要向您的朋友描述这个信号。这项任务并不是最简单的任务。在这种情况下,将信号描述为数字序列将更加简单。
图3:模拟信号示例
每个样本都以其自身的幅度进行描述。用户可以根据自己的喜好选择采样率。下图显示了如何根据采样定理将模拟信号转换为数字信号。
图4:模拟信号转换为数字信号
采样率必须根据人类听觉范围——20Hz至20000Hz——进行选择。为了能够获得特定信号(即准确声音)的所有必要信息,我们的采样率必须满足以下奈奎斯特-香农定理才能将其转换为离散时间信号:
采样率必须大于信号频谱中最高(最大)频率的两倍。在我们的例子中,最大频率为20000Hz。
本项目我们选择48000Hz——这是处理音频信号时的一个标准值。在这种情况下,信号处理时连续时间信号中的所有信息都没有丢失。
说到采样率,一般有2种情况:
过采样 – 维基百科
采样频率显著高于奈奎斯特速率。从理论上讲,如果以奈奎斯特速率或高于奈奎斯特速率进行采样,就可以完美重建有限带宽的信号。奈奎斯特速率的定义为信号中最高频率分量的两倍。
欠采样 (或走样) – 维基百科
这种技术以低于其奈奎斯特速率(高截止频率的两倍)的采样率采样带通滤波信号,但是仍然能够重建信号。如果以欠采样方式采样一个带通信号时,采样点与高频信号的低频分量采样点无法区分(即信号变得难以区分)。
接下来,我们通过正弦波进行演示。
图5:一个正弦波(在MATLAB中绘制)
这是一个频率为2Hz、时域为[-1,1]的正弦波。该波形包含4个周期,这意味着每0.5秒(1/2 Hz)发生一个周期。我们会对这个信号实施多种采样案例,以了解采样的工作原理。
采样点数表示在一个周期内添加了多少个点,并这些点会用插值算法连接起来。一个周期的最小点数应为20,否则线性插值信号看起来就会失真。这尤其适用于平滑的模拟信号,采样后会丢失圆边图案。点的数量越多,采样信号越准确。
图6:正弦波的必要点数(在MATLAB中绘制)
在本教程中,我们会在MATLAB中绘制一些正弦波,并观察采样频率不同时这些正弦波的行为。在语音信号系列的第二部分中,我们将使用MATLAB进行傅立叶分析。使用Arduino时,MATLAB也是一个非常有用的工具,因为它可以利用串行接口很好地进行通信。我们将在本系列的第三部分中详细介绍如何用Arduino录制语音信号并在MATLAB中进行处理。
对于那些不完全熟悉MATLAB的人,绘制函数的一般步骤如下所示:
要创建脚本或函数,请转到 [HOME] → [New] ,然后选择“Script”(脚本)或“Function”(函数)。
要绘制图7中所示的正弦波,我们需要创建一个Script。复制并粘贴以下代码:
f = 1 points = 5; t = 0:1/points:1; wave = sin(2*pi*f*t); subplot(4,1,1) plot(t,wave) title('5 points plot') points1 = 10; t = 0:1/points1:1; wave1 = sin(2*pi*f*t); subplot(4,1,2) plot(t,wave1) title('10 points plot') points2 = 15; t = 0:1/points2:1; wave2 = sin(2*pi*f*t); subplot(4,1,3) plot(t,wave2) title('15 points plot') points3 = 20; t = 0:1/points3:1; wave3 = sin(2*pi*f*t); subplot(4,1,4) plot(t,wave3) title('20 points plot')
要查看结果,您只需按 Run 按钮即可。
我们还需要创建另一个图——就在刚刚创建的图上绘制,以查看我们对信号进行采样时信号的形式如何变化。信号长度我们选取0.5秒,但是频率增加为60。我们处理的点数也修改为频率数的20倍。假设在这个区间内我们以50Hz的频率进行采样;这意味着每个点都位于T=1/50(其中T是采样周期)处。图7中的小红点就是信号上的采样点。
图7:欠采样正弦波
在图7中,由于缺少采样点,我们无法掌握原始信号的形状。连接采样点后,由于信号的点不足,红色信号的形状异常(图8)。这些点无法以正弦形式插值,红色信号不能重建蓝色信号。
图8:正弦波,fs = 50 Hz
图9:正弦波,fs = 240 Hz
图10: 采样频率示例
如图9和图10所示,当我们以2倍频率进行采样时,图中的唯一采样点就是顶部和底部的最大值。根据采样定理,这两个点足以重建信号。
第2步:处理语音信号
上文介绍了信号及其属性。现在我们需要用一个实际例子进行测试。Audacity的录音属性如下:
采样率: 48000 Hz
位数: 16
图11:Audacity录制所需的设置
信号长度应至少为10秒左右(项目会进行许多处理,因此不建议超过20秒)。
图12:Audacity
与其他录制平台相比,Audacity非常直观。在下图中,您可以看到一个中间有圆圈的红色按钮(record 图标) – 这就是开始录音的按钮。要停止录制,只需按下黄色方块按钮(stop 按钮)即可。程序会记录录音的声波,并将其绘制处理,如下图所示。
图13:录制的音频信号
第1部分简要介绍了数字信号处理理论。我们使用MATLAB探索了不同的信号波形,并用Audacity录制了自己的声音。在下一个教程中,我们将深入探讨“处理”的更多细节。我们将涉及各种算法和时频域。我们会继续利用MATLAB作为函数编写的主要工具,以处理我们录制的语音并获得分析结果。
审核编辑:汤梓红
-
matlab
+关注
关注
188文章
2992浏览量
232983 -
数字信号处理
+关注
关注
16文章
567浏览量
46479 -
语音信号
+关注
关注
3文章
70浏览量
23195
发布评论请先 登录
[共享] 数字信号处理及其MATLAB实现
用MatLab进行数字信号处理
《数字信号处理教程—MATLAB释义与实现》(第2版)程序集
什么是信号处理?如何进行数字信号处理呢?

搭建树莓派网络监控系统:顶级工具与技术终极指南!
树莓派网络监控系统是一种经济高效且功能多样的解决方案,可用于监控网络性能、流量及整体运行状况。借助树莓派,我们可以搭建一个网络监控系统,实时洞察网络活动,从而帮助识别问题、优化性能并确保网络安全。安装树莓派网络监控系统有诸多益处。树莓派具备以太网接口,还内置了Wi-Fi功能,拥有足够的计算能力和内存,能够在Linux或Windows系统上运行。因此,那些为L

STM32驱动SD NAND(贴片式SD卡)全测试:GSR手环生物数据存储的擦写寿命与速度实测
在智能皮电手环及数据存储技术不断迭代的当下,主控 MCU STM32H750 与存储 SD NAND MKDV4GIL-AST 的强强联合,正引领行业进入全新发展阶段。二者凭借低功耗、高速读写与卓越稳定性的深度融合,以及高容量低成本的突出优势,成为大规模生产场景下极具竞争力的数据存储解决方案。

芯对话 | CBM16AD125Q这款ADC如何让我的性能翻倍?
综述在当今数字化时代,模数转换器(ADC)作为连接模拟世界与数字系统的关键桥梁,其技术发展对众多行业有着深远影响。从通信领域追求更高的数据传输速率与质量,到医疗影像领域渴望更精准的疾病诊断,再到工业控制领域需要适应复杂恶劣环境的稳定信号处理,ADC的性能提升成为推动这些行业进步的重要因素。行业现状分析在通信行业,5G乃至未来6G的发展,对基站信号处理提出了极

史上最全面解析:开关电源各功能电路
01开关电源的电路组成开关电源的主要电路是由输入电磁干扰滤波器(EMI)、整流滤波电路、功率变换电路、PWM控制器电路、输出整流滤波电路组成。辅助电路有输入过欠压保护电路、输出过欠压保护电路、输出过流保护电路、输出短路保护电路等。开关电源的电路组成方框图如下:02输入电路的原理及常见电路1AC输入整流滤波电路原理①防雷电路:当有雷击,产生高压经电网导入电源时

有几种电平转换电路,适用于不同的场景
一.起因一般在消费电路的元器件之间,不同的器件IO的电压是不同的,常规的有5V,3.3V,1.8V等。当器件的IO电压一样的时候,比如都是5V,都是3.3V,那么其之间可以直接通讯,比如拉中断,I2Cdata/clk脚双方直接通讯等。当器件的IO电压不一样的时候,就需要进行电平转换,不然无法实现高低电平的变化。二.电平转换电路常见的有几种电平转换电路,适用于

瑞萨RA8系列教程 | 基于 RASC 生成 Keil 工程
对于不习惯用 e2 studio 进行开发的同学,可以借助 RASC 生成 Keil 工程,然后在 Keil 环境下愉快的完成开发任务。

共赴之约 | 第二十七届中国北京国际科技产业博览会圆满落幕
作为第二十七届北京科博会的参展方,芯佰微有幸与800余家全球科技同仁共赴「科技引领创享未来」之约!文章来源:北京贸促5月11日下午,第二十七届中国北京国际科技产业博览会圆满落幕。本届北京科博会主题为“科技引领创享未来”,由北京市人民政府主办,北京市贸促会,北京市科委、中关村管委会,北京市经济和信息化局,北京市知识产权局和北辰集团共同承办。5万平方米的展览云集

道生物联与巍泰技术联合发布 RTK 无线定位系统:TurMass™ 技术与厘米级高精度定位的深度融合
道生物联与巍泰技术联合推出全新一代 RTK 无线定位系统——WTS-100(V3.0 RTK)。该系统以巍泰技术自主研发的 RTK(实时动态载波相位差分)高精度定位技术为核心,深度融合道生物联国产新兴窄带高并发 TurMass™ 无线通信技术,为室外大规模定位场景提供厘米级高精度、广覆盖、高并发、低功耗、低成本的一站式解决方案,助力行业智能化升级。

智能家居中的清凉“智”选,310V无刷吊扇驱动方案--其利天下
炎炎夏日,如何营造出清凉、舒适且节能的室内环境成为了大众关注的焦点。吊扇作为一种经典的家用电器,以其大风量、长寿命、低能耗等优势,依然是众多家庭的首选。而随着智能控制技术与无刷电机技术的不断进步,吊扇正朝着智能化、高效化、低噪化的方向发展。那么接下来小编将结合目前市面上的指标,详细为大家讲解其利天下有限公司推出的无刷吊扇驱动方案。▲其利天下无刷吊扇驱动方案一

电源入口处防反接电路-汽车电子硬件电路设计
一、为什么要设计防反接电路电源入口处接线及线束制作一般人为操作,有正极和负极接反的可能性,可能会损坏电源和负载电路;汽车电子产品电性能测试标准ISO16750-2的4.7节包含了电压极性反接测试,汽车电子产品须通过该项测试。二、防反接电路设计1.基础版:二极管串联二极管是最简单的防反接电路,因为电源有电源路径(即正极)和返回路径(即负极,GND),那么用二极

半导体芯片需要做哪些测试
首先我们需要了解芯片制造环节做⼀款芯片最基本的环节是设计->流片->封装->测试,芯片成本构成⼀般为人力成本20%,流片40%,封装35%,测试5%(对于先进工艺,流片成本可能超过60%)。测试其实是芯片各个环节中最“便宜”的一步,在这个每家公司都喊着“CostDown”的激烈市场中,人力成本逐年攀升,晶圆厂和封装厂都在乙方市场中“叱咤风云”,唯独只有测试显

解决方案 | 芯佰微赋能示波器:高速ADC、USB控制器和RS232芯片——高性能示波器的秘密武器!
示波器解决方案总述:示波器是电子技术领域中不可或缺的精密测量仪器,通过直观的波形显示,将电信号随时间的变化转化为可视化图形,使复杂的电子现象变得清晰易懂。无论是在科研探索、工业检测还是通信领域,示波器都发挥着不可替代的作用,帮助工程师和技术人员深入剖析电信号的细节,精准定位问题所在,为创新与发展提供坚实的技术支撑。一、技术瓶颈亟待突破性能指标受限:受模拟前端

硬件设计基础----运算放大器
1什么是运算放大器运算放大器(运放)用于调节和放大模拟信号,运放是一个内含多级放大电路的集成器件,如图所示:左图为同相位,Vn端接地或稳定的电平,Vp端电平上升,则输出端Vo电平上升,Vp端电平下降,则输出端Vo电平下降;右图为反相位,Vp端接地或稳定的电平,Vn端电平上升,则输出端Vo电平下降,Vn端电平下降,则输出端Vo电平上升2运算放大器的性质理想运算

ElfBoard技术贴|如何调整eMMC存储分区
ELF 2开发板基于瑞芯微RK3588高性能处理器设计,拥有四核ARM Cortex-A76与四核ARM Cortex-A55的CPU架构,主频高达2.4GHz,内置6TOPS算力的NPU,这一设计让它能够轻松驾驭多种深度学习框架,高效处理各类复杂的AI任务。

米尔基于MYD-YG2LX系统启动时间优化应用笔记
1.概述MYD-YG2LX采用瑞萨RZ/G2L作为核心处理器,该处理器搭载双核Cortex-A55@1.2GHz+Cortex-M33@200MHz处理器,其内部集成高性能3D加速引擎Mail-G31GPU(500MHz)和视频处理单元(支持H.264硬件编解码),16位的DDR4-1600/DDR3L-1333内存控制器、千兆以太网控制器、USB、CAN、
评论