0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在家庭监护机器人中实现基于ATK的实时语音识别系统设计

电子设计 来源:郭婷 作者:电子设计 2018-12-28 08:59 次阅读

语音是人类最常用的交流方式,也是人类和计算机交流最渴望的方式。因此用语音同计算机交流也成为了最近研究的热点,计算机对语音的理解是计算机科学中的一个引人人胜的、富有挑战性的课题。

进入90年代,随着多媒体时代的来临,迫切要求语音识别系统从实验室走向实用。许多发达国家如美国、日本、韩国以及IBM、Apple、AT&T、NTT等着名公司都为语音识别系统的实用化开发研究投以巨资。IBM公司于1997年开发出汉语ViaVoice语音识别系统,次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统ViaVoice'98.目前市场上已经出现了语音识别电话、语音识别记事本等产品,如美国VPTC公司的Voice Organizer和法国的Parrot等。

我国语音识别研究工作开始的较晚,但近年来发展得很快,一直紧跟国际水平,国家也很重视,并把大词汇量语音识别的研究列入"8 63"计划,由中科院声学所、自动化所、清华大学电子工程系及北京大学等单位研究开发,取得了高水平的科研成果,如中科院自动化所研制的非特定人、连续语音听写系统和汉语语音人机对话系统,其字准确率或系统响应率可达90%以上。鉴于中国未来庞大的市场,国外也非常重视汉语语音识别的研究。美国、新加坡等地聚集了一批来自大陆、***、香港等地的学者,研究成果已达到相当高水平。

1 系统设计

文中是家庭监护机器人项目中的语音识别系统设计部分,设计目的是设计出一种可以识别语音的、协助监护家庭行动不方便人员的机器人。为实现该语音识别系统,设计了语音识别系统总体结构框图,如图1所示。

在家庭监护机器人中实现基于ATK的实时语音识别系统设计

图1 系统总体结构框图

1.1 硬件设计

文中所研究和设计的功能,都是应用在移动机器人上的。因而系统的研究设计需要考虑到体积小、省电、便于移动的特性,并需具有便于家庭用户操作的友好显示界面。对于语音识别部分,需要用到用于语音识别算法处理的处理器、语音采集电路和语音输出电路,如图2所示。其中语音识别算法运算的处理器主要负责算法的运算处理,相当于机器人的大脑;语音采集电路负责采集外部的声音信号,相当于机器人的耳朵;语音输出电路负责输出话语声音,相当于机器人的嘴巴。

在家庭监护机器人中实现基于ATK的实时语音识别系统设计

图2 系统硬件结构图

1)语音识别算法处理器选择

根据系统设计功能的要求,目前常用的语音识别芯片种类一般有:单片机MCU)、DSP和SoC(System on Circuit)。考虑到普通单片机(MCU)资源的紧缺及运行速度较慢的缺点,因而在本系统设计将不考虑使用单片机(MCU)作为语音识别的处理器。DSP包含用作数字信号处理的专用部件,运算能力强、精度高,但目前DSP的价格比较高,同时考虑到本系统的特性,需要选择一种既有较强的运算能力,合适于语音识别的功能,并且能实现较好的用户操作界面,并带有文件系统(用于识别地图)的功能,因而选择DSP并不是明智之举。目前Texas Instruments公司新推出的一款芯片OMAP3530,它具有双内核ARM CortexTM-A8的内核和TMS320C64+TM DSP内核,属于高性能的OMAP35x架构系列产品,满足了系统设计的各种功能特性要求。

2)语音编解码芯片选择

机器人选择一款合适的语音处理芯片是非常重要的。考虑到系统中用到了各种电源,并需要对电源进行管理,因此选择TI公司配套的TPS 65930芯片来作为系统语音识别部分的音频编解码处理功能的硬件平台是非常合适的。该芯片是一个集成了电源管理ADC嵌入式电源控制(EPC)、全功能的音频编解码器于一体的芯片,满足了系统所有电源管理和音频编解码的需要,为设计的PCB板节省了空间,同时减少了多电源硬件设计的负责布线烦恼。

3)电路设计

本文的设计是用在移动机器人上的,因而需要语音的输入、识别处理及语音输出的功能。对于语音的输入采集,本文使用声音传感器麦克风及外围电路来实现。对于语音输出部分,使用功率放大器结合喇叭来使用。设计语音部分原理图如图3所示。

在家庭监护机器人中实现基于ATK的实时语音识别系统设计

图3 语音输入原理图

1.2 软件设计

HTK(Hidden Markov Model Toolkit)是一套专门的建立和处理隐马可夫模型(HMMs)的实验工具包,由英国剑桥大学工程系(Cambridge University Engineering Department,CUED)开发的,主要应用于语音识别领域,也可以应用于语音合成、字符识别和DNA排序等研究领域。HTK经过剑桥大学、Entropic公司及Microsoft公司的不断增强和改进,使其在语音识别领域处于世界领先水平。

基于HTK的语言识别时,识别结果适用只能显示在DOS或终端上,而且不利于将结果保存、移植或者二次开发利用。在本语音识别系统中使用了HTK接口工具ATK(AnApplication Toolkit for HTK)。ATK是由英国剑桥大学开发的开源语音识别工具,是对HTK的C++多线程封装,跟HTK一样,它支持Linux和Windows,它包括HTK(HTKLib)、AHTK、AGram、ANGram、ADict、AHMMs、AResource、ARMan、ARec、ACode、ASour ce、ATee、AComponent、ABuffer、APacket、Asyn、FLite(SYNLib)、ALog模块部件。

基于ATK的语音识别软件应用系统的由语音信号采集模块、基于DMA的双向高速RAM存取模块、ATK语音识别模块、系统管理模块、语音输出模块等模块组成,如图4所示。

在家庭监护机器人中实现基于ATK的实时语音识别系统设计

图4 系统软件设计结构图

在软件设计中,系统管理模块主要负责系统的总体管理调度,是应用系统的调度中心;语音信号采集模块主要负责控制数据采集芯片TPS 65930;基于DMA的双向RAM存取模块主要负责实现DMA驱动及双向RAM的读写存取,使用了通道1来实现高速地把语音信号采集到的数据存储到RAM上,并使用通道2实现高速地把RAM的数据取出来,用于语音的识别;语音输出模块主要负责把相应的音频数据送到TPS65930,并控制TPS6 5930对接收到的音频解码输出到功放电路,实现语音输出的功能。软件的设计流程图如图5所示。

在家庭监护机器人中实现基于ATK的实时语音识别系统设计

图5 软件设计流程

2 语音识别系统实验及结果

文中设计的语音识别系统如图6所示。在实验中总共进行了3轮话语测试,每轮300句话语测试,其中150句为家庭监护机器人需要识别的话语,150句话语为机器人不予置理的无关话语。本系统只设置10个需要识别的话语,由15名学生分别读音进行测试。同时对无关话语也是由该15名学生,每人10句分别随机读音测试。从显示结果可以看出,第1轮中,先测试的150句无关话语中,能正确识别出无关话语数为150句,识别出无关话语率为100%,但对需识别的话语中,正确识别出148句,2句识别出错,识别率为98.67%;在第2轮中,同样先测试的150句无关话语中,能正确识别出无关话语数为150句,识别出为无关话语率为100%,但对需识别的话语中,正确识别出142句,8句识别出错,识别率为94.67%;在第3轮中,同样先测试的150句无关话语中,能正确识别出无关话语数为150句,识别出无关话语率为100%,但对需识别的话语中,正确识别出146句,识别率为97.33%.在3轮测试中,系统都能实时响应所有语句,未出现漏句现象。并且在实验测试的过程中,系统的响应速度都非常快,感观上没有时间延迟,与真人交流速度相当。

在家庭监护机器人中实现基于ATK的实时语音识别系统设计

图6 系统实验界面

从实验测试结果可看出,对于识别10个需要识别的话语的识别率高达94.67%以上,具有较高的识别率,因而该语音识别系统较好达到了家庭监护机器人使用的要求。

3 结论

文中通过DSP、DMA和ARM Cortex-A8的并行处理,利用双缓冲的方法,在嵌入式Linux上实现了基于ATK的实时语音识别系统。该系统可以实时地实现语音识别,具有较高识别率,较快的响应速度。可以应用在家庭监护机器人及其相关领域中。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    28189

    浏览量

    206447
  • 计算机
    +关注

    关注

    19

    文章

    7413

    浏览量

    87694
  • 语音识别
    +关注

    关注

    38

    文章

    1721

    浏览量

    112535
收藏 人收藏

    评论

    相关推荐

    基于DSP的高速实时语音识别系统的设计

    实时语音识别系统中,由于语音的数据量大,运算复杂,对处理器性能提出了很高的要求,适于采用高速DSP实现。虽然DSP提供了高速和灵活的硬件设计
    发表于 10-03 11:10 2117次阅读
    基于DSP的高速<b class='flag-5'>实时</b><b class='flag-5'>语音</b><b class='flag-5'>识别系统</b>的设计

    实时语音识别系统在家庭监护机器人电路设计

    文中所研究和设计的功能,都是应用在移动机器人上的。因而系统的研究设计需要考虑到体积小、省电、便于移动的特性,并需具有便于家庭用户操作的友好显示界面
    发表于 10-23 15:39 1915次阅读
    <b class='flag-5'>实时</b><b class='flag-5'>语音</b><b class='flag-5'>识别系统</b><b class='flag-5'>在家庭</b><b class='flag-5'>监护</b><b class='flag-5'>机器人</b>电路设计

    实时语音识别系统在家庭监护机器人实现

    文中阐述的是家庭监护机器人项目中语音识别系统设计的部分,通过DSP、DMA和ARM Cortex-A8的并行处理,利用双缓冲的方法,在嵌入式
    发表于 12-16 14:14 2930次阅读

    智能家庭应用之语音识别系统

    开发基于自然语言的语音识别系统面临许多技术挑战,包括使用精确的语音识别引擎将机器听到的内容翻译成文字—以及一个综合的自然语言处理器
    发表于 10-20 09:31 4237次阅读

    智能机器人在家用医疗保健中的设计

    。    机器人听觉是语音识别技术,医疗保健智能机器人带有各种声交互系统,能够按照家庭成员的命令
    发表于 11-28 10:13

    会物体识别语音识别的nao机器人

    Nuance公司作为技术合作伙伴,开发性能稳定且功能强大的语音识别系统。nao机器人可在2米范围内听到您说话,并能听懂一整句话或关键词汇。由此,人们与nao机器人之间的交谈就变得更加流
    发表于 02-13 14:09

    【Aworks申请】家庭服务机器人

    申请理由:以开发板为处理器,利用深度传感器Kinect,实现家庭服务机器人的 物体识别技术、人体识别技术、动态不确定环境下的自定位、地图创建
    发表于 07-19 23:33

    微信控制的家庭智能机器人(附语音聊天、人脸检测、自主巡航等)

    ,或者微信对机器人进行一个部署。并且会报警处理一些事情,例如降温功能,人脸检测报警等。当用户在家时,机器人可以为用户播放音乐、电影、语音识别
    发表于 09-30 14:33

    基于DSP的汉字语音识别系统如何实现

    基于DSP的汉字语音识别系统如何实现
    发表于 03-12 06:33

    语音识别系统在智能家庭系统中的应用是什么?

    语音识别系统在智能家庭系统中的应用是什么?
    发表于 05-31 06:54

    嵌入式语音识别系统中的电路设计是如何的

    现在社会发展的这么快,什么高科技都涌现出来,什么智能机器人啦,智能手机等,有很多在这里就不一一列举了,在这里我们要说的就是语音识别系统了,现在嵌入式产品如此的多,就像一些智能空调啦,我们可以对着他说
    发表于 12-20 07:52

    语音识别系统在家庭监护机器人实现

    文中对该系统的软硬件进行了设计。在硬件方面,给出语音识别系统的硬件组成原理,并提供了关键部分原理图;在软件方面,提出实时语音
    发表于 05-09 15:10 234次下载
    <b class='flag-5'>语音</b><b class='flag-5'>识别系统</b><b class='flag-5'>在家庭</b><b class='flag-5'>监护</b><b class='flag-5'>机器人</b>的<b class='flag-5'>实现</b>

    基于STM32的语音识别系统的设计与实现

    基于STM32的语音识别系统的设计与实现
    发表于 11-09 18:03 50次下载

    ATK实时语音识别系统监护机器人中的应用分析

    多媒体时代的来临,迫切要求语音识别系统从实验室走向实用。许多发达国家如美国、日本、韩国以及IBM、Apple、ATT、NTT等著名公司都为语音识别系统的实用化开发研究投以巨资。IBM公
    发表于 10-24 10:35 0次下载
    <b class='flag-5'>ATK</b><b class='flag-5'>实时</b><b class='flag-5'>语音</b><b class='flag-5'>识别系统</b>在<b class='flag-5'>监护</b><b class='flag-5'>机器人中</b>的应用分析

    语音识别技术在智能语音机器人中的应用

    语音识别技术在智能语音机器人中的应用,一般语音机器人的设计开发主要着眼于“能听会说”,力图利用
    的头像 发表于 06-12 11:24 5478次阅读