0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音识别技术的分类及识别方法

jf_78858299 来源:自动化控制技术控 作者:控侯成敬 2023-04-13 16:03 次阅读

语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术车联网也得到了充分的引用,例如在翼卡车联网中,只需按一键通客服人员口述即可设置目的地直接导航,安全、便捷。

语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),(迅 捷ocr文字识别软件)其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。

主 要 分 类

根据识别的对象不同,语音识别任务大体可分为3类,即孤立词识别(isolated word recognition),关键词识别(或称关键词检出,keyword spotting)和连续语音识别。其中,孤立词识别 的任务是识别事先已知的孤立的词,如“开机”、“关机”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或一段话;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现,如在一段话中检测“计算机”、“世界”这两个词。

根据针对的发音人,可以把语音识别技术分为特定人语音识别和非特定人语音识别,前者只能识别一个或几个人的语音,而后者则可以被任何人使用。显然,非特定人语音识别系统更符合实际需要,但它要比针对特定人的识别困难得多。

另外,根据语音设备和通道,可以分为桌面(PC)语音识别、电话语音识别和嵌入式设备(手机、PDA等)语音识别。不同的采集通道会使人的发音的声学特性发生变形,因此需要构造各自的识别系统。

识 别 方 法

语音识别方法主要是模式匹配法。在训练阶段,用户将词汇表中的每一词依次说一遍,并且将其特征矢量作为模板存入模板库。在识别阶段,将输入语音的特征矢量依次与模板库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。

存 在 问 题

1、口音和噪声

语音识别中最明显的一个缺陷就是对口音和背景噪声的处理。

2、语义错误

通常语音识别系统的实际目标并不是误字率。我们更关心的是语义错误率,就是被误解的那部分话语。

3、单通道和多人会话

一个好的会话语音识别器必须能够根据谁在说话对音频进行划分,还应该能弄清重叠的会话(声源分离)。

4、其他领域变化

如:来自声环境变化的混响、硬件造成的伪影、音频的编解码器和压缩伪影、采样率的变化、会话者的年龄不同。

5、上下文相关联判断识别

人类聊天容易基于上下文做判断。机器目前很难做到。

和自然语言识别的区别

语音识别是自然语言识别的一个方向。

广义的“自然语言处理”包含了“语音”,或者说“语音”也是“自然语言”的一种。狭义的“自然语言处理”是指处理及理解文本,简单的理解就是:语音识别的结果成了自然语言处理的原材料来源之一,自然语言处理的结果又成了语音生成的原材料。

它是区别指令式语音而命名,其基本原理都是一致。自然语音识别亮点是自然语言理解功能,即用户可以按照个人的语言习惯,用自己惯用的语气、惯用的词,将需要被识别的语音任务说出来即可。自然语音识别与指令式语音识别主要区别是词库大小及处理方式,指令语音所有处理都是本地进行,自然语音识别目前基本都是采用云处理方式,这样其语音库及处理能力是指令语音无法比拟的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别技术

    关注

    0

    文章

    54

    浏览量

    12824
  • ASR
    ASR
    +关注

    关注

    2

    文章

    35

    浏览量

    18691
  • OCR
    OCR
    +关注

    关注

    0

    文章

    142

    浏览量

    16303
收藏 人收藏

    评论

    相关推荐

    电阻识别方法

    电阻识别方法
    发表于 08-02 21:59

    基于贝叶斯分类研究肌肉动作模式识别方法

    采用贝叶斯分类研究肌肉动作模式识别方法 提出了一种结合AR 模型和贝叶斯分类的肌电信号动作模式识别方法。首先将采集到的肌电信号进行预处理,提取AR 系数作为
    发表于 02-22 16:11 25次下载

    色环电阻识别方法

    色环电阻识别方法 首先,从电阻的底端,
    发表于 07-17 17:42 1.3w次阅读
    色环电阻<b class='flag-5'>识别方法</b>

    硬盘标识识别方法

    硬盘标识识别方法 Seagate硬盘的编号比较简单,其识别方法为:"ST+硬盘尺寸+容量+主标识+副标识+接口类型"。    为了另大家容易理解,简单的
    发表于 09-04 12:56 6467次阅读

    常用塑料识别方法

    常用塑料识别方法
    发表于 11-19 10:30 552次阅读

    电容的识别方法

    电容的识别方法 电容的识别方法与电阻的识别方法基本相同,分直标法、色标法和数标法3种。 电容的基本单位用法拉(F)表示,其它单位还
    发表于 02-06 18:13 6342次阅读

    电容识别方法及换算

    电容的识别方法与电阻的识别方法基本相同,分直标法、色标法和数标法3种。 电容的基本单位用法拉(F)表示,其它单位还有:毫法(mF
    发表于 06-10 11:57 2654次阅读

    基于最小l_1稀疏图表学习分类的图像识别方法研究

    基于最小l_1稀疏图表学习分类的图像识别方法研究_蒋业文
    发表于 01-07 16:00 0次下载

    语音情感识别方法

    为有效利用语音情感词局部特征,提出了一种融合情感词局部特征与语音语句全局特征的语音情感识别方法。该方法依赖于
    发表于 11-23 11:16 0次下载

    基于自适应多分类器融合的手势识别方法

    为了提高基于可穿戴设备手势识别的性能,针对单分类器在手势识别时会出现偏向性的问题,提出了基于自适应多分类器融合的手势识别方法(Self- a
    发表于 05-18 14:39 10次下载

    基于人体骨架的行为识别方法综述

    基于人体骨架的行为识别方法综述
    发表于 06-04 14:21 6次下载

    结合MFCC和特征的语音情感识别方法

    语音情感识别中提取梅尔频率倒谱系数(MFC℃)会丢失谱特征信息,导致情感识别准确率较低。为此,提出一种结合MFCC和语谱图特征的语音情感识别方法
    发表于 06-11 11:02 23次下载

    人脸识别技术分类和实现方法

    人脸识别技术可以根据不同的分类方法进行分类。根据识别方式,可以分为基于特征分析和基于模型的
    的头像 发表于 06-29 18:10 1420次阅读

    电容的识别方法与电阻的识别方法.pdf

    识别方法: 电容的识别方法与电阻的识别方法基本相同分直标法、色标法和数标法3种电容的基本单位用法拉(F)表示其它单位还有:毫法(mF)、微法(uF)、纳法(nF)、皮法(pF)其中:1法拉=103
    发表于 10-17 09:40 8次下载

    保险电阻的识别方法

    保险电阻识别方法  保险电阻的正确识别对于电子设备的正常运行和使用安全至关重要。本文旨在详尽、详实、细致地探讨保险电阻的识别方法,帮助读者更好地理解和应用该技术。 一、保险电阻的基本概
    的头像 发表于 12-15 10:55 1395次阅读