0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

详谈机器学习的智能语音处理技术

如意 来源:今日头条 作者:华章科技 2021-01-27 16:08 次阅读

机器学习的快速发展,为智能语音处理奠定了坚实的理论和技术基础。智能语音处理的主要特点是从大量的语音数据中学习和发现其中蕴含的规律,可以有效解决经典语音处理难以解决的非线性问题,从而显著提升传统语音应用的性能,也为语音新应用提供性能更好的解决方案。

01 智能语音处理的基本概念

为简化处理,经典的语音处理方法一般都建立在线性平稳系统的理论基础之上,这是以短时语音具有相对平稳性为前提条件的。但是,严格来讲,语音信号是一种典型的非线性、非平稳随机过程,这就使得采用经典的处理方法难以进一步提升语音处理系统的性能,如语音识别系统的识别率等。

随着机器人技术的不断发展,以机器人智能语音交互为代表的语音新应用迫切要求发展新的语音处理技术与手段,以提高语音处理系统的性能水平。

近十年来,人工智能技术正以前所未有的速度向前发展,机器学习领域不断涌现的新技术、新算法,特别是新型神经网络深度学习技术等极大地推动了语音处理的发展,为语音处理的研究提供了新的方法和技术手段,智能语音处理应运而生。

至今为止,智能语音处理还没有一个精确的定义。广义上来说,在语音处理算法或系统实现中全部或部分采用智能化的处理技术或手段均可称为智能语音处理。

02 智能语音处理的基本框架

“声源-滤波器”模型虽然能够有效地区分声源激励和声道滤波器,对它们进行高效的估计,但语音产生时发声器官存在着协同动作,存在紧耦合关系,采用简单的线性模型无法准确描述语音的细节特征。

同时,语音是一种富含信息的信号载体,它承载了语义、说话人、情绪、语种、方言等诸多信息,分离、感知这些信息需要对语音进行十分精细的分析,对这些信息的判别也不再是简单的规则描述,单纯对发声机理、信号的简单特征采用人工手段去分析并不现实。

类似于人类语言学习的思路,采用机器学习手段,让机器通过“聆听”大量的语音数据,并从语音数据中学习蕴含其中的规律,是有效提升语音信息处理性能的主要手段。与经典语音处理方法仅限于通过提取人为设定特征参数进行处理不同,智能语音处理最重要的特点就是在语音处理过程或算法中体现从数据中学习规律的思想。

图1-5给出了智能语音处理的三种基本框架,图中虚线框部分有别于经典语音处理方法,包含了从数据中学习的思想,是智能语音处理的核心模块。

详谈机器学习的智能语音处理技术

▲图1-5 智能语音处理的基本框架

其中,图1-5a是在经典语音处理特征提取的基础上,在特征映射部分融入了智能处理,是机器学习的经典形式,图1-5b和图1-5c是表示学习的基本框架,其中图1-5c是深度学习的典型框架,“深度层次化的抽象特征”是通过分层的深度神经网络结构来实现的。

03 智能语音处理的基本模型

智能语音处理是智能信息处理的一个重要研究领域,智能信息处理涉及的模型、方法、技术均可应用于智能语音处理。智能语音处理的基本模型和技术主要来源于人工智能,机器学习作为人工智能的重要领域,是目前智能语音处理中最常用的手段,而机器学习中的表示学习和深度学习则是智能语音处理中目前最为成功的智能处理技术。

详谈机器学习的智能语音处理技术

▲图1-6 AI/ML/RL/DL的关系图

图1-6展示了人工智能(Artificial Intelligence,AI)、机器学习(Machine Learning,ML)、表示学习(Representation Learning,RL)及深度学习(Deep Learning,DL)的相互关系。

下面列出了近年来在智能语音处理中常见的模型和技术。

1. 稀疏与压缩感知

一个事物的表示形式决定了认知该事物的难度。在信息处理中,具有稀疏特性的信号表示更易于被感知和辨别,反之则难以辨别。因此,寻找信号的稀疏表示是高效解决信息处理问题的一个重要手段。

利用冗余字典,可以学习信号自身的特点,构造信号的稀疏表示,并进一步降低采样和处理的难度。这种字典学习方法为信息处理提供了新的视角。对语音信号采用字典学习,构造语音的稀疏表示,为语音编码、语音分离等应用提供了新的研究思路。

2. 隐变量模型

语音的所有信息都包含在语音波形中,隐变量模型假设这些信息是隐含在观测信号之后的隐变量。通过利用高斯建模、隐马尔可夫建模等方法,隐变量模型建立了隐变量和观测变量之间的数学描述,并给出了从观测变量学习各模型参数的方法。

通过参数学习,可以将隐变量的变化规律挖掘出来,从而得到各种需要的隐含信息。隐变量模型大大提高了语音识别、说话人识别等应用的性能,在很长一段时间内都是智能语音处理的主流手段。

3. 组合模型

组合模型认为语音是多种信息的组合,这些信息可以采用线性叠加、相乘、卷积等不同方式组合在一起。具体的组合方式中需要采用一系列模型参数,这些模型参数可以通过学习方式从大量语音数据中学得。这类模型的提出,有效改善了语音分离、语音增强等应用的性能。

4. 人工神经网络与深度学习

人类面临大量感知数据时,总能以一种灵巧的方式获取值得注意的重要信息。模仿人脑高效、准确地表示信息一直是人工智能领域的核心挑战。

人工神经网络(Artificial Neural Network,ANN)通过神经元连接成网的方式,模拟了哺乳类动物大脑皮层的神经通路。和生物的神经系统一样,ANN通过对环境输入的感知和学习,可以不断优化性能。

随着ANN的结构越来越复杂、层数越来越多,网络的表示能力也越来越强,基于ANN进行深度学习成为ANN研究的主流,其性能相对于很多传统的机器学习方法有较大幅度的提高。但同时,深度学习对输入数据的要求也越来越高,通常需要有海量数据的支撑。

ANN很早就应用到了语音处理领域,但由于早期受到计算资源的限制,神经网络层数较少,语音处理应用性能难以提升,直到近年来深层神经网络的计算资源、学习方法有了突破之后,基于神经网络的语音处理性能才有了显著的提升。

深度神经网络可以学到语音信号中各种信息间的非线性关系,解决了传统语音处理方法难以解决的问题,已经成为当前智能语音处理的重要技术手段。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3226

    浏览量

    48807
  • 机器学习
    +关注

    关注

    66

    文章

    8406

    浏览量

    132562
  • 智能语音
    +关注

    关注

    10

    文章

    782

    浏览量

    48758
收藏 人收藏

    评论

    相关推荐

    机器学习技术在图像处理中的应用

    在本章中,我们将讨论机器学习技术在图像处理中的应用。首先,定义机器学习,并
    的头像 发表于 10-18 16:08 2294次阅读

    【TL6748 DSP申请】基于DSP的语音识别技术研究及实现

    申请理由:在校大三学生,电子信息工程信号处理方向,特别想学习一下DSP信号处理技术学习过随机信号分析、信号系统课程并且正在
    发表于 10-09 15:08

    智能语音机器

    ` 本帖最后由 星希望532 于 2015-12-2 20:06 编辑 作品名称:基于微型操作系统的智能多平台控制语音机器人http://v.youku.com/v_show
    发表于 12-02 19:08

    基于深度学习技术智能机器

    ——工业机器人的智能化程度要求也越来越高,采用深度学习技术为工业机器人赋能是目前各大厂商的统一认知。本文结合实际案例,简要说明一下
    发表于 05-31 09:36

    请问电销机器智能语音识别的原理是什么?

    一个人们最为关心的问题大概就是,电销机器人如何做到语音识别,通俗来讲,就是电销机器人如何“听懂”人们说话?其实语音识别技术是人工
    发表于 06-12 14:03

    人工智能机器学习的前世今生

    如何传授给计算机的过程。任何机器使用算法以智能方式执行任务,这就是展现的人工智能机器学习是人工智能
    发表于 08-27 10:16

    人工智能——MATLAB图像处理机器学习

    视觉、通讯、计算金融学、控制设计、机器人学等等。 为了帮助大家更好的学习机器学习和图像处理,我们上线了《人工智能—MATLAB图像
    发表于 07-01 15:05

    【 平头哥CB5654语音开发板试用连载】智能取货机器人语音交互模组

    项目名称:智能取货机器人语音交互模组试用计划:申请理由本人在机器人控制有七年多的学习和开发经验,曾参与设计过类似巡检机器人,参与语音交互硬件
    发表于 02-25 16:05

    AI智能语音机器人 揭秘让企业电销轻松拓客神器

    AI智能语音机器人是一款基于人工智能开发的,适用于产品业务或服务推广需求的语音营销服务平台!通过精准语音
    发表于 07-21 22:54

    机器技术机器学习

    机器技术机器学习正成为嵌入式系统硬件和软件供应商的下一个重大事件。嵌入式系统可以通过网络连接和物联网(IoT)来传递信息、共享资源。无论是智能
    发表于 12-20 06:03

    什么是人工智能机器学习、深度学习和自然语言处理

    垂直领域得到广泛应用。根据2020年的一项估计,37% 的组织已经在使用这种或那种形式的人工智能。大多数人工智能的应用是特定的技术,如计算机视觉、自然语言处理
    发表于 03-22 11:19

    《移动终端人工智能技术与应用开发》人工智能的发展与AI技术的进步

    人工智能打发展是算法优先于实际应用。近几年随着人工智能的不断普及,许多深度学习算法涌现,从最初的卷积神经网络(CNN)到机器学习算法的时代。
    发表于 02-17 11:00

    智能语音机器人的使用误区你知道吗

    电销机器人=AI人工智能+语音识别技术+语音知识库+话术逻辑+智能
    发表于 07-04 14:29 1142次阅读

    机器学习可以分为哪几类?机器学习技术有哪些?

    机器学习可以分为哪几类?机器学习技术有哪些 机器学习
    的头像 发表于 08-17 16:11 5645次阅读

    机器学习技术是什么?机器学习技术在新型电力系统安全稳定中的应用

    一些能够推断未知数据的规则和模型。机器学习技术目前已经广泛应用于许多领域,如图像和语音识别、自然语言处理、金融风险管理等等。 在电力系统安全
    的头像 发表于 08-17 16:30 1102次阅读