0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音识别技术的发展史

454398 来源:工程师吴畏 2019-04-30 11:49 次阅读

从前年开始,海外谷歌、亚马逊、苹果、微软、三星,国内阿里、小米、京东等都已先后涉足智能音箱这一领域。随着其快速发展,作为核心技术之一的语音识别技术也逐步进入人们的视线,本篇我们就来谈谈语音识别技术。

语音识别技术简介

语音识别,也被称为自动语音识别(Automatic Speech Recognition,ASR)技术,就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术,也就是让机器听懂人类的语音。

所谓听懂,有两层意思,一是指把用户所说的话逐词逐句转换成文本;二是指正确理解语音中所包含的要求,作出正确的应答。

语音识别技术目前在桌面系统、智能手机、导航设备等嵌入式领域均有一定程度的应用。

语音识别系统及过程

不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统的实现过程如下图所示。

语音识别的基本过程有两个部分组成。一是学习和训练,二是识别过程。

训练(Training):预先分析出语音特征参数,制作语音模板(Template)并存放在语音参数库中。

识别(Recognition):待识语音经过与训练时相同的分析,得到语音参数,将它与库中的参考模板一一比较,并采用判决的方法找出最接近语音特征的模板,得出识别效果。

语音识别系统的分类

(1)根据对说话人说话方式的要求,可以分为孤立字(词)语音识别系统,连接字语音识别系统以及连续语音识别系统。

孤立单词识别(Isolated Word Recognition):识别的单元为字、词或短语,它们组成识别的词汇表(Vocabulary),对它们中的每一个通过训练建立模板或模型。

连续单词识别(Connected Word Recognition):以比较少的词汇为对象,能够完全识别每个词。识别的词汇表和标准样板或模型也是字、词或短语,但识别时可以是它们中间几个的连续。

连续语音识别(Continuous Speech Recognition):以多数词汇为对象,待识语音是一些完整的句子。虽不能完全准确识别每个单词,但能够理解其意义,连续语音识别也叫会话语音识别。可理解为在语音识别之后,根据语言学知识来推断语音的含义内容。

(2)根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统。

特定人语音识别(Speaker-Dependent):语音识别的标准模板或模型只适应于某个人。实际上,该模板或模型就是该人通过输入词汇表中的每个字、词或短语的语音建立起来的。其他人使用时,需同样建立自己的标准模板或模型。

非特定人语音识别(Speaker-Independent):语音识别的标准模板或模型适应于指定的某一范畴的说话人(比如标准普通话),标准模板或模型由该范畴的多个人通过训练而产生。识别时可供参加训练的发音人使用,也可供未参加训练的同一范畴的发音人使用。

(3)根据词汇量大小,可以分为有限词汇以及无限词汇量语音识别系统。

有限词汇识别:按词汇表中字、词或短句个数的多少,大致分为:100以下小词汇量;100-1000中等词汇量;1000以上为大词汇量。

无限词汇识别(全音节识别):当识别基元为汉语普通话中对应所有汉字的可读音节时,称其为全音节语音识别,是实现无线词汇或中文文本输入的基础。

语音识别技术的“前世今生”

下面我们来看看语音识别技术的“前世今生”:

(1)起始阶段

1952年AT& T Bell实验室实现了一个单一发音人孤立发音的十个英文数字的语音识别系统,方法主要是度量每个数字的元音音段的共振峰。

1960年英国的Denes等人研究成功了第一个计算机语音识别系统。在此期间,提出的一些思想沿用至今。

理论:模式识别思想、动态规划算法、时间规划算法、动态因素跟踪法。

(2)快速发展阶段

70年代孤立词发音和孤立语句发音的识别成为了可行的有用技术,大规模的语音识别研究在这个时期得到很大的发展。

80年代研究的重点转向了词汇量的积累,以及连续的语音识别,也就是从传统的基于标准模板匹配的技术思路转变基于统计模型的技术思路。此外,再次提出了将神经网络技术引入语音识别的技术思路。

理论:声学模型—隐马尔科夫模型(Hidden Markov Model,HMM)

语言模型—N-gram模型

(3)应用开发

90年代,语音识别研究的重点转向自然语言的识别处理,任务转移到航空旅行信息的索取。同时,语音识别技术不断应用于电话网络,增强话务员服务和自动化。

2000年以来,人机语音交互成为研究的焦点。研究重点包括即兴口语的识别和理解,自然口语对话,以及多语种的语音同声翻译。

理论:声学模型—隐马尔科夫模型—深度神经网络(Deep Neural Network,DNN)

语言模型—N-gram模型—反馈神经网络(Feedback Neural Network,FNN)

语音识别领域公司

科大讯飞,腾讯,百度,苏州思必驰,捷通华声,云知声等等。

结语

随着语音识别技术的不断发展,无论是Siri、Echo,还是其他的智能语音助手都可以接触和管理消息、邮件和日程帐号,还能控制联网家居,播放音乐,甚至完成网络搜索或者更多的事情。而我们,只需满怀期待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    38

    文章

    1721

    浏览量

    112543
收藏 人收藏

    评论

    相关推荐

    ASR语音识别技术应用

    ASR(Automatic Speech Recognition)语音识别技术,是计算机科学与人工智能领域的重要突破,能将人类语音转换为文本,广泛应用于智能家居、医疗、交通等多个领域。
    的头像 发表于 11-18 15:12 292次阅读

    简述半导体材料的发展史

    半导体材料的发展史是一段漫长而辉煌的历程,它深刻地影响了现代信息社会的发展轨迹。从最初的发现到如今的广泛应用,半导体材料经历了从第一代到第三代的演变,每一次进步都带来了技术上的巨大飞跃。
    的头像 发表于 08-15 16:03 1135次阅读

    三菱电机功率器件发展史

    三菱电机从事功率半导体开发和生产已有六十多年的历史,从早期的二极管、晶闸管,到MOSFET、IGBT和SiC器件,三菱电机一直致力于功率半导体芯片技术和封装技术的研究探索,本篇章带你了解三菱电机功率器件发展史
    的头像 发表于 07-24 10:17 554次阅读
    三菱电机功率器件<b class='flag-5'>发展史</b>

    人工智能的语音识别技术详解

    随着科技的飞速发展,人工智能(AI)技术已经渗透到我们生活的方方面面,其中语音识别技术作为AI领域的重要分支,更是以其独特的魅力和广泛的应用
    的头像 发表于 07-01 11:39 1074次阅读

    电阻柜的发展史

    电阻柜发展史
    的头像 发表于 03-08 15:22 403次阅读

    车内语音识别技术在智能驾驶中的应用与前景

    一、引言 随着智能驾驶技术的快速发展,车内语音识别技术逐渐成为智能驾驶领域的研究热点。语音
    的头像 发表于 02-19 11:46 752次阅读

    车内语音识别技术:智能驾驶的核心要素

    一、引言 随着科技的飞速发展,智能驾驶已经成为未来出行的趋势。作为智能驾驶的关键技术之一,车内语音识别技术发挥着越来越重要的作用。它不仅提升
    的头像 发表于 02-19 11:42 708次阅读

    车内语音识别技术:智能驾驶的革新之源

    一、引言 随着科技的飞速发展,智能驾驶已经成为现代交通领域的热门话题。作为智能驾驶的关键技术之一,车内语音识别技术正在改变我们对驾驶的认知。
    的头像 发表于 02-19 10:10 414次阅读

    车内语音识别技术:重塑智能驾驶的未来

    一、引言 随着科技的飞速发展,智能驾驶已经成为未来交通的必然趋势。作为智能驾驶的关键技术之一,车内语音识别技术正逐渐成为研究的热点。它不仅提
    的头像 发表于 02-19 10:09 593次阅读

    语音数据集:智能驾驶中车内语音识别技术的基石

    一、引言 在智能驾驶中,车内语音识别技术发挥着越来越重要的作用。语音数据集作为这一技术的基石,其质量和规模对
    的头像 发表于 01-31 16:07 491次阅读

    机器人技术发展史简介

    机器人的诞生地在美国,1962年美国研制出世界上第一台工业机器人,经过30多年的发展,美国现已成为世界上的机器人强国之一,基础雄厚,技术先进。综观它的发展史,道路是曲折不平坦的。
    发表于 12-20 10:17 1282次阅读

    离线语音识别与在线语音识别有什么不一样?

    离线语音识别与在线语音识别有什么不一样? 离线语音识别和在线
    的头像 发表于 12-12 14:36 1158次阅读

    浅谈情感语音识别技术发展与未来趋势

    一、引言 情感语音识别是一种新兴的人工智能技术,它通过分析人类语音中的情感信息,实现人机之间的情感交互。本文将探讨情感语音
    的头像 发表于 11-30 11:06 691次阅读

    情感语音识别技术前沿与未来趋势

    前沿 深度学习模型的持续优化:随着深度学习技术的不断发展,情感语音识别技术也在持续优化。新型的深度学习模型,如变分自编码器(VAE)、生成对
    的头像 发表于 11-28 18:35 566次阅读

    情感语音识别技术发展与挑战

    一、引言 情感语音识别是人工智能领域的重要研究方向,它通过分析人类语音中的情感信息,实现人机之间的情感交互。本文将探讨情感语音识别
    的头像 发表于 11-28 18:26 621次阅读