0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

声音隔离技术增强与识别语言准确度

电子设计 作者:电子设计 2018-09-27 07:35 次阅读

在嘈杂的环境中,对于手机、可穿戴设备和其它智能设备来说声音隔离技术能够提升语音增强和识别准确度

声音或语音用户接口在手机、平板电脑、可穿戴设备和其它智能设备上变得越来越普遍和重要,因为这项技术确实让这些设备不需要再设计键盘或者触摸屏。为了能够提供更精确的语音处理过程,系统在设计时必须要保证对语音正确可靠的识别,即使在复杂的噪声环境条件中。

目前已经有数百万人已经依赖自动语音识别技术来将语音转换为文字来编写文档和生成文本。然而自动语音识别的质量主要依赖于一些最优条件,比如假设每个人说话的方式与声音训练数据非常类似,讲话处在安静的环境中避免噪声干扰,即使这样也需要工作人员来修改文字错误、标点以及语法错误,此外还可能存在其他类型的翻译错误。语音技术的持续改进对于提升设备对人类语言的识别准确度非常有必要,在手机、智能设备应用以及诸如汽车这样的噪声环境下语音识别技术的效果对其能否成功至关重要。

图1:噪声环境下声音隔离技术提升设备的语音增强和识别效果

语音增强是基于声音隔离和噪声抑制技术,本篇文章主要介绍声音隔离技术,实现噪声剔除和语音增强,因此下面只对噪声抑制做了简要介绍。

噪声抑制技术能够帮助去除不同类型的背景噪声,防止干扰语音识别。噪声的显著特征主要体现在时间域和频域,时间域的噪声包括连续、断续和脉冲型的噪声,频域噪声包括宽频带和窄频带噪声。办公室和交通的声音、操作设备的声音和嘶嘶声是典型的连续型噪声,这类噪声变化非常慢。非连续型噪声是重复的噪声,比如喇叭或者铃铛的声音。脉冲式的噪声通常比较生硬如点击和重击的声音。宽频噪声如嘶嘶声可能有不同的频率,窄频噪声的发生往往在一定的频率范围内,包括正弦波、嗡嗡声和机器噪声。

工程师们已经尝试了各种滤波技术,每种技术会对不同类型的噪声都有一定的积极作用。然而每种噪声的特性会随着时间有些改变,工程师可能也需要采用自适应算法来动态匹配噪声的变化,一些噪声剔除技术的例子包括频率补偿、脉冲过滤、自适应宽频滤波、自适应逆向滤波和立体滤波等。

认识声音隔离技术

声音隔离是提升语音识别度的一种新型方法,传统的方式是屏蔽和过滤不同的噪声,声音隔离技术则侧重于鉴别人语音的某种具体特征来判定和传输有效的语音,从而过滤掉背景噪声。声音隔离技术能够显著提升语音的清晰度和识别度,即使在噪声环境中。为了能够可靠的鉴别人语音的部分,声音隔离系统需要采用声学和语言模型,这里向大家介绍了两种目前嵌入式设计中采用的建模方法。第一种是深度神经网络算法,第二种是耳蜗仿真,即模拟人听力系统从内耳到大脑的行为。

采用深度神经网络的方法需要一个大型数据库,包含数百小时以上的噪声和语音,用于训练算法系统。起初在这个数据库对语音没有概念,通过大量的训练开始学习鉴别人类不同的语音模式,声音隔离的质量包括能够判定不同声音的来源,通过两个或者更多的麦克风来采集音频数据能够提升其效果,这个网络甚至能够训练识别是谁在发声、何时在发声等效果。

数据库包含的信息会被用来创建小型快速算法,然后移植到目标数字信号处理器DSP)上来执行实现语音的监测和分类。根据数据库中存储的信息开发出来的自适应算法的组合就被称为神经网络。

神经网络算法会将输入的声音进行分解,对不同的声音分段来分析来判定人不同的语音模式,神经网络会分析声音段的不同特征包括频率、谐波、“攻击”和衰减特性,从而从环境声音中区分出语音。神经网络会基于音频采样率来权衡性能,低采样率需要的处理更少当然精确度也会低,越高的采样率越精确,当然计算处理过程也更复杂。

不同的滤波算法用于声波纹识别同时移除不想要的音频部分,多通滤波器的使用会更有效的过滤同时能够恢复任何丢失的音频部分。在后处理阶段通过设置不同的算法参数,声音能够被一定程度的优化适合人的听力系统或者用于语音识别系统,这非常重要因为人类和语音识别系统采用不同的语音解析方式。

耳蜗仿真

这种声音隔离方法采用DSP平台运行计算机听觉场景分析(CASA)算法来模拟人类听觉系统将语音从噪声环境中提取出来。这种方式会对音频信息进行编码从而实现分组和解析。目前有几十种分组依据涉及时间和频率相关,包括音高、空间位置和起始/结束时间。

音高是一个非常重要的分组依据,它根据不同的谐波模式来鉴别某种声音的唯一特征。当采用两个或者多个麦克风时,声音隔离系统可以根据空间位置信息来确定每个麦克风声音的方向和距离。CASA建模方式使得声音隔离系统实现“鸡尾酒会效应”,让系统能够集中于某一声音源,比如某个特定的人,并且屏蔽掉背景声音。起始/停止时间分组指的是某一声音成分开始出现和停止的时刻,这些数据与原始的频率数据合并时就能够判断是否来自同一声音源。

图2:各种声音隔离方法被采用实现所谓的“鸡尾酒会效应”,即屏蔽掉一系列噪声集中识别某一特定的声音源。

具有相似属性的声音会形成同一音频流,同样的,不同的属性的会形成各自的音频流。这个系统就可以采用这些不同的音频流来鉴别持续或者重复的声源。一旦有了足够的声音分组,实际的声音隔离处理就会从已经鉴别过的声源中去匹配,并且响应真正说话者的声音。逆向转换可将数据重新构造为音频流并传输供人来听。

注意事项

声音隔离不仅适合提供高质量的语音——语音识别系统,还有很多其他重要应用。比如在紧急情况下往往是比较嘈杂混乱的环境,这时快速且准确的语音通讯对于生命安全非常关键,通过清晰的语音识别急救人员就能够快速的定位求救人员。相比噪声抑制方法,声音隔离提供了一种更加高效的机制,尽管在不可控的环境条件下也能够提升语音通信识别度。

专用的DSP声音处理器能够带来性能的优化同时保持较低的功耗,尤其对于一直打开的语音应用或者要求用户手动(比如长按按钮)初始化激活语音识别接口非常重要,需要一直打开的语音功能不可避免的要持续造成功耗,因为系统处理器一直保持活动状态。与此相反,为了节省电池能量,需要一直打开的语音应用可以采用专用的语音处理器,这种处理器支持睡眠模式,保留一定的功能,此外还支持低功耗监听模式以及全功能唤醒模式。

语音功能不再仅面向手持设备和智能手机了,可穿戴设备正式得益于用户语音功能才不需要设计键盘或者触摸屏功能了。随着语音功能的成熟,用户与设备之间的距离也会增加。举个例子,现在一些智能电视支持语音命令,这些电视一般会放在客厅,同时需要考虑用户隐私和安全问题,需要重新执行完善的方案,相信用户语音功能会在更多的传统电子产品设备中获得应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 手机
    +关注

    关注

    35

    文章

    6841

    浏览量

    157282
  • 语音识别
    +关注

    关注

    38

    文章

    1709

    浏览量

    112475
  • 可穿戴设备
    +关注

    关注

    55

    文章

    3800

    浏览量

    166772
收藏 人收藏

    评论

    相关推荐

    准确度温度***可调报警信号

    准确度温度***可调报警信号
    发表于 08-14 12:05

    准确度、精密度和精确

    最终正确地评定测量结果时,通常要用到准确度、精密度和精确三个概念。它们的意义如下:1、准确度指测量值与真值的接近程度,反映系统误差的影响,系统误差小则准确度高。2、 精密度指测量值重
    发表于 02-08 09:21

    基于LTC6802的电池管理系统准确度提升

    DN471 - 简单的校准电路最大限度地提高了锂离子电池管理系统中的准确度
    发表于 05-06 10:09

    请问F28335的AD采样频率与准确度是怎么变化的?

    采样频率变大,采样的准确度怎么变化?
    发表于 06-09 15:11

    影响焊接测量准确度的因素有哪些

    、三秒钟,待温度稳定;  5)阅读并记录显示的温度数值。  影响测量准确度的因素:  1)温度计准确度:正如一般的测量仪器一样,仪器的准确度会影响测量的结果,建议使用专用烙铁温度测试器。测试仪器也需要作
    发表于 09-04 17:09

    什么是准确度/精确

    什么是准确度(真实)?什么是精确
    发表于 01-25 07:12

    如何去设计高准确度可程控延迟快前沿脉冲信号源系统?

    准确度可程控延迟快前沿脉冲信号源系统原理是什么?高准确度可程控延迟快前沿脉冲信号源系统是由什么组成的?如何去设计高准确度可程控延迟快前沿脉冲信号源系统?
    发表于 04-20 07:31

    准确度的取样保持电路

    准确度的取样保持电路
    发表于 04-11 10:48 726次阅读
    高<b class='flag-5'>准确度</b>的取样保持电路

    提高了准确度的取样保持电路

    提高了准确度的取样保持电路
    发表于 04-11 10:51 730次阅读
    提高了<b class='flag-5'>准确度</b>的取样保持电路

    准确度电阪应变式称重传感器补偿技术

    本文具体分析、探讨了获得高准确度电阻应变式称重感器的各种硬件补尝的原理、技术和方法
    发表于 02-06 00:09 38次下载

    借助 NVIDIA GPU,亚马逊Alexa语义识别模型的识别准确度提高了15%

    通过训练一个深度学习系统来帮助亚马逊Alexa语音助手识别并忽略那些并非是对她说的话,从而将其语义识别模型的识别准确度提高了15% 。
    的头像 发表于 05-09 15:01 2888次阅读
    借助 NVIDIA GPU,亚马逊Alexa语义<b class='flag-5'>识别</b>模型的<b class='flag-5'>识别</b><b class='flag-5'>准确度</b>提高了15%

    影响示波器测量准确度的因素,有哪些提高准确度的使用技巧

    在示波器测量中出现准确度不够的问题比较常见,特别是在测量微弱小信号、相位噪声、小电压纹波、大电压中的小电压信号等更容易出现明显的误差。因此,工程师在测量前充分了解影响示波器测量准确度的因素、掌握其
    发表于 10-09 09:45 2175次阅读

    保证准确度为 0.04% 的混合 / 电动型汽车电池监视器包括隔离式接口

    保证准确度为 0.04% 的混合 / 电动型汽车电池监视器包括隔离式接口
    发表于 03-20 16:29 1次下载
    保证<b class='flag-5'>准确度</b>为 0.04% 的混合 / 电动型汽车电池监视器包括<b class='flag-5'>隔离</b>式接口

    探头及附件的准确度如何验证?

    探头及附件的准确度如何验证呢,今天我们通过一则实例来学习一下。
    的头像 发表于 06-06 09:34 514次阅读
    探头及附件的<b class='flag-5'>准确度</b>如何验证?

    湿度传感器的哪些特性影响测量准确度

    湿度传感器的哪些特性影响测量准确度? 湿度传感器测量准确度受到许多特性的影响。下面将详细介绍影响湿度传感器测量准确度的一些重要特性。 1. 温度 湿度传感器的测量准确度受环境温度的影响
    的头像 发表于 12-25 14:28 898次阅读