语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。 语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
语音识别原理:
语音识别系统本质上是一种多维模式识别系统。它与一般的模式识别系统类似,包括语音预处理、语音特征提取、语音模式库和语音模式匹配等基本单元,如图1所示。
1)语音预处理:包括预加重、反混叠滤波、端点检测、噪声滤波等处理过程,用以去除声门激励、口鼻辐射、高于1/2 采样频率的高频和噪声信号的影响,实现语音信号的数字化。
2)语音特征提取:对经过预处理后的语音信号进行特征参数分析。该过程就是从原始语音信号中抽取出能够反映语音本质的特征参数,形成特征矢量序列。可选择的语音特征参数包括: 时域参数、频域参数、声道的形状函数、随机模型的概率函数、量化矢量和超音段信息函数等。
3)语音模式库:即声学参数模板,它是用聚类分析等方法,从一个讲话者或多个讲话者多次重复的语音参数中经过长时间训练得到的。
4)语音模式匹配:将输入语音的特征参数同训练得到的语音模式库进行比较分析,从而得到识别结果。
随着信息技术的飞速发展,人们寻求一种更为直接的人机对话方式,声控电脑就是再此基础上发展起来的。声控电脑使用语音识别技术,而语音识别是目前一种热门技术。电脑语音识别系统,可以用声音直接控制电脑工作,是人机接口中最具有人性化的方式。
声控电脑原理
声控电脑是由人的声音发出指令来控制电脑工作的,可是电脑本身不能识别人的声音,因此必须让电脑先了解熟悉人讲话的声音及腔调来建立参考样本,将原先训练好的声音特色保存为语音参考样本存入电脑。原理流程如图1所示。
DSP组成及控制
(1)组成
DSP语音识别芯片;数字/模拟转换电路;语音提示语ROM;参数存储SRAM。
数字/模拟转换电路是将语音模拟信号转换成数字信号,交DSP芯片做分析处理,然后将其存储在SRAM中。如果要说出所讲的声音,同样是经过数字/模拟转换电路将其转换为模拟信号,经驱动电路,可以将声音还原。
(2)控制
SETUSER选取某一使用者(最多支持8人)。
GETSTATVS取回主控CPU状态值。
TRAIN语音参考样本输入。
RECOG语音识别对比。
SAVESTATVS存储主控CPU状态值。
COMPARE识别对比找出最相近的一组样本。
声控系统硬件电路
将20PIN排针插座,连接至8051单片机控制板上,DSP和8051的信号传输都由此总线来完成。8051用于主控系统,主要做声控系统的人机接口处理,所用到的接口包括键盘及LCD信息显示,并以8051单片机来控制DSP芯片用于语音识别。如果将RS232与PC机连接,便可以将信息传回PC而显示在屏幕上。除可以显示信息外,还可以做程序设计时修改错误,在系统开发时相当有用。系统组成原理如图2所示。
本系统采用DSP控制芯片,使硬件成本降低,可以独立操作,不必靠个人电脑来做语音识别的控制,最主要的是其语音识别效果佳且稳定
AP70032单片机语音识别电路设计
新型单片语音识别电路HL7003-02,电路结构简单、外围元器件少,设计、制作、调式及操作十分容易,适合爱好者制作各种由语控制的游艺机、家电控制、智能玩具、语音门锁、门钟等等方面。它是根据用户自己的声音输入而识别的音晶片识音辩识的单片IC,它能识别12个不同的字句,可控制不同的输出开关,完成指定的功能。
电路特点:内置麦克风放大器,内置A/D转换器,12个1.5秒长的字句识别。多功能I/O口,2个普通输入脚,4个触发输入脚,2个输出端口,包含一个4输出口及一个输出口,2个LED输出驱动动,不同的编码方式,可做成专用的线路,2.4V~3.3V工作电压,低功耗,自动断电功能。
单片语音识别电路HL7003-02
1、通电后,先按①键,LED1和POA1(LED3)同时亮,此时立刻对着话筒发话(语音长度不超过1.5秒),POA1灭,LED1亮,再对着话筒进行“学习”,LED2、POA1同时亮,表示“学习”成功。接着再按②键,LED1、POA2同时亮。依此类推,直至1~12键全部学习完毕。也可以对某一键或某几个键进行无序输入和学习。
2、学习完毕,即可进行语音识别操作,12路输出可分别控制不同的电器(或动作),12路语音识别可任意操作,即喊一句便控制一种电器的开或关。第11键为输出转换键,每转换控制一种电器都需按一下该键。
3、若需清除“学习”内容,应按清除键“C”,再次输入时,须重新按照第1步方法进行“学习”。
4、PIM1接“1”(高电平),为12键模式,应用电路见图。PIM1接“0”(低电平),为8键模式,应用电路见图2。POSL接“0”,POA1~POA12输出为低电平,POSL接“1”,POA1~POA12输出为高电平。
评论
查看更多