0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于语音识别在人工智能时代作用和分析介绍

英特尔物联网 来源:djl 2019-09-11 10:39 次阅读

智能时代,语音识别

神经网络深度学习

语音识别技术方便于长辈们融入海量数据的互联网时代,成为长辈们与外界交流的一大利器。不过,千万不要认为在未来人工智能时代中的语音识别仅仅是单纯运用到手机聊天中的识别录入文字。语音识别技术随着深度学习及高性能计算的不断发展,正逐渐从实验室迈向工业领域。

语音识别简史

1952年,美国AT&T贝尔实验室开发出了第一个基于电子计算机的语音识别系统Audrey,其可以识别10个英文数字,准确率为98%;进入60年代,语音识别领域的两大突破是线性预测编码,以及动态时间规整技术;

在60年代后期,隐马尔可夫模型被Leonard E. Baum等人提出,HMM的提出是语音识别历史上的一个重大突破,使当时语音识别的错误率大大降低;李开复等人则在1988年第一次实现了基于HMM的大词汇量语音识别系统Sphinx。

另一方面,早在上世纪80年代,人工神经网络已经被引入语音识别。起初人工神经网络的结构多为简单的多层感知机,但受限于当时的计算能力以及语音数据的稀少,人工神经网络并没有在识别率上带来很大的提升。

近年来,随着计算能力的提升和语音数据的增加,神经网络被广泛应用于语音识别任务中。深度神经网络技术的出现,也进一步提高了大规模连续语音识别的性能,目前已经成为学术界和工业界研究的热点内容之一。

语音识别的技术支持

目前,在语音识别领域广泛采用的神经网络有时延神经网络、深度神经网络、卷积神经网络、递归神经网络以及基于长短期记忆的RNN等。

通常将这些深度神经网络模型与HMM模型结合构建完整的声学模型,并结合语言模型等提升语音识别性能。

在语言模型方面,虽然传统的N元模型一直是主流技术,但基于神经网络的语言模型从2012年开始被较为广泛的研究,如RNN-LM、LSTM-LM等。

鉴于基于神经网络的语言模型的计算量较大,一般先利用N元模型初始化,然后再用基于神经网络的语言模型重打分,即神经网络语言模型并不直接用于解码,而是在基线系统解码结果的基础上进行得分重估。

同时,RNN-CTC的出现使得语音识别摆脱了传统方法中声学模型、语言模型、解码器等模块化的束缚,通过采用对输入输出序列直接建模的方法,只需训练一个神经网络模型即可进行识别,因此被称为端到端语音识别。

端到端的模型可以解决传统方法中各个模型训练目标不一致的问题。另外,由于实际中可获取的文本数据比语音数据多得多,所以往往还会用文本数据训练一个更好的语言模型,与CTC神经网络结合使用。

深度神经网络用于人工智能应用的问题在于其实时率等性能指标还需有待提高,但是端到端语音识别开辟了人工智能的一个新方向,而且训练的过程相对简单,因此人工智能方向上的端到端识别将会是未来的技术趋势之一。此外人工智能再进一步改进网络结构、改进训练方法,逐步使人工智能性能达到工业水平和要求,进入商用阶段指日可待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4765

    浏览量

    100553
  • 语音识别
    +关注

    关注

    38

    文章

    1725

    浏览量

    112556
  • 人工智能
    +关注

    关注

    1791

    文章

    46882

    浏览量

    237633
收藏 人收藏

    评论

    相关推荐

    嵌入式和人工智能究竟是什么关系?

    人工智能的结合,无疑是科技发展中的一场革命。在人工智能硬件加速中,嵌入式系统以其独特的优势和重要性,发挥着不可或缺的作用。通过深度学习和神经网络等算法,嵌入式系统能够高效地处理大量数据,从而实现
    发表于 11-14 16:39

    《AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    探讨了人工智能如何通过技术创新推动能源科学的进步,为未来的可持续发展提供了强大的支持。 首先,书中通过深入浅出的语言,介绍人工智能在能源领域的基本概念和技术原理。这使得我对人工智能
    发表于 10-14 09:27

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    很幸运社区给我一个阅读此书的机会,感谢平台。 《AI for Science:人工智能驱动科学创新》第4章关于AI与生命科学的部分,为我们揭示了人工智能技术在生命科学领域中的广泛应用和深远影响。在
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    人工智能:科学研究的加速器 第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习、深度学习等先进技术,AI能够处理和分析海量数据,发现传统方法难以捕捉的模式和规律。这不仅极大地提高了数据处理
    发表于 10-14 09:12

    risc-v在人工智能图像处理应用前景分析

    RISC-V在人工智能图像处理领域的应用前景十分广阔,这主要得益于其开源性、灵活性和低功耗等特点。以下是对RISC-V在人工智能图像处理应用前景的详细分析: 一、RISC-V的基本特点 RISC-V
    发表于 09-28 11:00

    人工智能ai 数电 模电 模拟集成电路原理 电路分析

    人工智能ai 数电 模电 模拟集成电路原理 电路分析 想问下哪些比较容易学 不过好像都是要学的
    发表于 09-26 15:24

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    活的世界? 编辑推荐 《AI for Science:人工智能驱动科学创新》聚焦于人工智能与材料科学、生命科学、电子科学、能源科学、环境科学五大领域的交叉融合,通过深入浅出的语言和诸多实际应用案例,介绍
    发表于 09-09 13:54

    FPGA在人工智能中的应用有哪些?

    FPGA(现场可编程门阵列)在人工智能领域的应用非常广泛,主要体现在以下几个方面: 一、深度学习加速 训练和推理过程加速:FPGA可以用来加速深度学习的训练和推理过程。由于其高并行性和低延迟特性
    发表于 07-29 17:05

    人工智能神经网络芯片的介绍

    人工智能神经网络芯片是一类专门为深度学习和神经网络算法设计的处理器。它们具有高性能、低功耗、可扩展等特点,广泛应用于图像识别语音识别、自然语言处理等领域。以下是
    的头像 发表于 07-04 09:33 597次阅读

    人工智能语音识别技术详解

    随着科技的飞速发展,人工智能(AI)技术已经渗透到我们生活的方方面面,其中语音识别技术作为AI领域的重要分支,更是以其独特的魅力和广泛的应用前景,引起了社会各界的广泛关注。本文将详细介绍
    的头像 发表于 07-01 11:39 1094次阅读

    5G智能物联网课程之Aidlux下人工智能开发(SC171开发套件V2)

    ://t.elecfans.com/v/27221.html *附件:初学者完整学习流程实现手写数字识别案例_V2-20240506.pdf 人工智能 语音对话机器人案例 26分03秒 https
    发表于 05-10 16:46

    5G智能物联网课程之Aidlux下人工智能开发(SC171开发套件V1)

    *附件:初学者完整学习流程实现手写数字识别案例.pdf 人工智能 语音对话机器人案例 26分03秒 https://t.elecfans.com/v/27185.html *附件:语音
    发表于 04-01 10:40

    嵌入式人工智能的就业方向有哪些?

    嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下,嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下,众多名企也纷纷在嵌入式人工智能
    发表于 02-26 10:17

    语音数据集:推动人工智能语音技术的关键要素

    随着人工智能技术的飞速发展,语音技术已成为人机交互领域的重要一环。语音数据集作为支撑语音技术研发与应用的基础资源,对于推动人工智能
    的头像 发表于 12-29 11:00 579次阅读

    语音数据集在人工智能中的应用与挑战

    一、引言 随着人工智能技术的快速发展,语音数据集在各种应用中发挥着越来越重要的作用语音数据集是AI语音技术的基石,对于
    的头像 发表于 12-14 15:00 652次阅读