0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音识别技术必定会渗透在人们生活的每个角落

Dbwd_Imgtec 来源:未知 作者:李倩 2018-04-20 14:55 次阅读

一、概述

作为最自然的人机交互方式 ——语音,正在改变人们的生活,丰富多媒体技术的应用。语音识别技术是语音信号处理的一个重要分支,也是近年来很火的一个研究领域。随着科技的飞速发展,语音识别不仅在桌面PC和大型工作站得到了广泛应用,而且在嵌入式系统领域也占有一席之地,如智能家居、语音助手、车载语音识别系统等。相信在不久的将来,语音识别技术必定会渗透在人们生活的每个角落。

二、语音识别系统的分类

语音识别按照说话人的说话方式可以分为孤立词(IsolatedWord)识别、连接词(Connected Word)识别和连续语音(Continuous Speech)识别。孤立词识别是指说话人每次只说一个词或短语,每个词或短语在词汇表中都算作一个词条,一般用在语音电话拨号系统中;连接词语音识别支持一个小的语法网络,其内部形成一个状态机,可以实现简单的家用电器的控制,而复杂的连接词语音识别系统可以用于电话语音查询、航空订票等系统;连续语音识别是指对说话人以日常自然的方式发音,通常特指用于语音录入的听写机。

从识别对象的类型来看,语音识别可以分为特定人(SpeakerDependent)语音识别和非特定人(Speaker Independent)语音识别。特定人是指只针对一个用户的语音识别,非特定人则可用于不同的用户。

从识别的词汇量大小可以分为小词汇量(词数少于100)、中等词汇量(词数100~500)和大词汇量(词数多于500)。

非特定人大词汇量连续语音识别是近几年研究的重点,也是研究的难点。目前的连续语音识别大多是基于HMM(隐马尔科夫模型)框架,并将声学、语言学的知识统一引入来改善这个框架,其硬件平台通常是功能强大的工作站或PC机。

三、语音识别的原理

语音识别就是对麦克风输入的语音信号进行解析和理解,并将其转化为相应的文本或命令。

一个完整的语音识别系统主要包括三个部分:

语音特征提取(前端处理部分):目的是滤除各种干扰成分,从语音波形中提取出随时间变化的能表现语音内容的特征矢量序列。

声学模型和模式匹配(识别算法):声学模型通常由获得的语音特征通过训练产生,目的是为每个发音建立发音模板。在识别时将输入的语音特征同声学模型进行匹配与比较,得到最佳识别结果。

语义理解(后处理):计算机对识别结果进行语义、语法分析,明白语音的意义以便做出相应的反应,通常通过语言模型来实现。

语音识别原理如下图所示:

待识别语音经话筒转化为电信号后加在识别系统的输入端,经过预处理,接着进行语音特征提取,用反映语音信号特征的若干参数来代表原始语音。常用的语音特征包括:线性预测系数(LPC)、线性预测倒谱系数(LPCC)、Mel频谱系数(MFCC)等。

接下来分为两个阶段::训练阶段和识别阶段。

在训练阶段,对用特征参数形式表示的语音信号进行相应处理,获得表示识别基本单元共性特点的标准数据,以此构成参考模板,将所有能识别的基本单元的参考模板结合在一起,形成参考模式库;

在识别阶段,将待识别的语音信号经特征提取后逐一与参考模式库中的各个模板按某种原则进行匹配,找出最相似的参考模板所对应的发音,即为识别结果。

最后进行语音处理,涉及语法分析、语音理解、语义网络等。

语音识别过程要根据模式匹配原则,计算未知语音模式与语音模板库中的每一个模板的距离测度,从而得到最佳的匹配模式。语音识别所应用的模式匹配方法主要有动态时间规整(Dynamic Time Warping,DTW),隐马尔科夫模型(Hidden Markov Model,HMM)和人工神经元网络(Artificial Neural Networks,ANN)。

四、难题

识别率是衡量语音识别系统性能好坏的一个重要指标,在实际应用中,识别率主要受到以下几个因素的影响:

对于汉语语音识别,方言或口音会降低识别率;

背景噪声。公共场所的强噪声对识别效果影响甚大,即使是在实验室环境下,敲击键盘、移动麦克风都会成为背景噪声;

“口语”问题。它既涉及到自然语言理解,又与声学有关。语音识别技术的最终目的是要让用户在“人机对话”时,能够像进行“人与人对话”一样自然,而一旦用户以跟人交谈的方式进行语音输入时,口语的语法不规范和语序不正常的特点会给语义的分析和理解带来困难。

此外,识别率还与说话人的性别、说话时间长短等有关。

实时性是衡量语音识别系统性能好坏的另一指标。对于具有高速运算能力的CPU和大容量存储器的PC而言,基本上能够满足实时性的要求;而对于资源有限的嵌入式系统来说,实时性几乎得不到保证。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    38

    文章

    7484

    浏览量

    163763
  • 智能家居
    +关注

    关注

    1928

    文章

    9553

    浏览量

    184936
  • 语音识别
    +关注

    关注

    38

    文章

    1739

    浏览量

    112634

原文标题:语音识别之初体验

文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    音频信息识别与检索技术

    随着互联网(Internet)和电信网等信息网络的蓬勃发展,人们的信息交互变得越来越方便,除了文字信息,语音、音乐、图像等多媒体信息也越来越多地进入了人们的日常生活中。例如,
    发表于 03-05 22:53

    优秀移动应用对人们生活的影响

    互联“指尖时代” 随着移动互联网市场规模的不断扩增,移动应用开始变得越来越多样化,服务越来越精细化,几乎已渗透到与人们生活息息相关的各个领域,每天人们只需轻轻的触碰指尖,就能够随时随地
    发表于 07-22 16:41

    基于labview的语音识别

    `1系统概述语音识别技术是二十世纪信息技术领域十大重要的科技发展技术之一。语音
    发表于 03-10 22:00

    LWIP数据量大时传输必定会终止但又能ping通是怎么回事?

    ; failed at line 650 in ..\LWIP\lwip-1.4.1\src\core\pbuf.c出现上面这些错误必定会丢数据;Assertion "pbuf_take
    发表于 08-29 00:50

    模式识别的关键技术

    领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安验证方式。而且利用基因算法训练连续隐马尔柯夫模型的
    发表于 12-11 14:17

    语音识别技术的概念及应用前景

    解决的问题,就是使得设备可以用听觉感知周围的世界,用声音和人做最自然的交互,让操控和生活更为便捷。 智能语音的基础在于通过神经网络技术,提升语音识别
    发表于 05-27 09:41

    2010年必定会成为pcb市场复苏的一年

    2010年必定会成为pcb市场复苏的一年 经历了2009年的衰退之后,无论是全球市场还是中国市场,2010年必定会成为pcb市场复苏的一年。
    发表于 01-25 09:02 874次阅读

    国内语音识别技术上市公司汇总_语音识别技术现状_语音识别原理及应用

    语音识别技术的发展已经普遍的存在了我们生活当中,本文主要详细介绍了语音识别
    发表于 12-13 18:04 9901次阅读
    国内<b class='flag-5'>语音</b><b class='flag-5'>识别</b><b class='flag-5'>技术</b>上市公司汇总_<b class='flag-5'>语音</b><b class='flag-5'>识别</b><b class='flag-5'>技术</b>现状_<b class='flag-5'>语音</b><b class='flag-5'>识别</b>原理及应用

    AI语音识别技术将改变我们的生活

    互联网人工智能的时代,各种各样的语音识别技术越来越智能成熟,生活中手机我们也常常都在使用语音
    发表于 08-29 16:27 1317次阅读

    声纹识别具备怎样的优势

    随着5G的商用进一步的推进了物联网的构建,万物互联作为发展目标,非接触式识别技术声纹识别必定会有非常大的应用场景。
    发表于 09-30 10:38 2189次阅读

    声纹识别具备怎样的优势

    随着5G的商用进一步的推进了物联网的构建,万物互联作为发展目标,非接触式识别技术声纹识别必定会有非常大的应用场景。
    发表于 04-22 16:24 3335次阅读

    美国发展EDA,华为业务必定会受到影响

    美国商务部针对华为进行制裁升级,除了祭出致命的晶圆代工外,另一大利器就是EDA,两大招一齐使出,华为轮值董事长郭平​也不得不承认华为业务必定会受到影响。
    发表于 07-14 08:54 959次阅读
    美国发展EDA,华为业务<b class='flag-5'>必定会</b>受到影响

    语音识别技术的行业应用与发展趋势

    一、引言 随着科技的不断发展,语音识别技术已经渗透到各个行业中,并逐渐改变着人们生活方式。本文
    的头像 发表于 10-18 16:10 941次阅读

    语音识别技术智能家居领域的应用与前景

    一、引言 随着人工智能和物联网技术的快速发展,智能家居成为了人们日常生活的重要部分。语音识别技术
    的头像 发表于 10-26 14:27 1306次阅读

    语音识别技术智能家居领域的创新应用与挑战

    随着人工智能和物联网技术的快速发展,智能家居成为了人们日常生活的重要部分。语音识别技术作为智能家
    的头像 发表于 11-01 17:11 836次阅读