0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

市场主流的麦克风阵列技术分析

电子设计 来源:互联网 作者:佚名 2018-01-16 09:38 次阅读

风吹麦浪,静夜虫鸣,人耳能听到的声音大约有40多万种,频率在20至20000赫兹之间;不仅如此,借助大脑,人类还具有分辨噪音和过滤干扰的能力。那么对于机器呢?

麦克风阵列是什么?

麦克风阵列(Microphone Array),从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。

早在20世纪70、80年代,麦克风阵列已经被应用于语音信号处理的研究中,进入90年代以来,基于麦克风阵列的语音信号处理算法逐渐成为一个新的研究热点。而到了“声控时代”,这项技术的重要性显得尤为突出。

麦克风阵列能干什么?

1.语音增强(Speech Enhancement)

语音增强是指当语音信号被各种各样的噪声(包括语音)干扰甚至淹没后,从含噪声的语音信号中提取出纯净语音的过程。所以DingDong在嘈杂环境下,也能准确识别语音指令。

通过麦克风阵列波束形成进行语音增强示意图

从20世纪60年代开始,Boll等研究者先后提出了针对使用一个麦克风的语音增强技术,称为单通道语音增强。因为它使用的麦克风个数最少,并且充分考虑到了语音谱和噪声谱的特性,使得这些方法在某些场景下也具有较好的噪声抑制效果,并因其方法简单、易于实现的特点广泛应用于现有语音通信系统与消费电子系统中。

但是,在复杂的声学环境下,噪声总是来自于四面八方,且其与语音信号在时间和频谱上常常是相互交叠的,再加上回波和混响的影响,利用单麦克风捕捉相对纯净的语音是非常困难的。而麦克风阵列融合了语音信号的空时信息,可以同时提取声源并抑制噪声。

目前基于线性阵列、平面阵列以及空间立体阵列的波束形成和降噪技术,效果均达到业界一流水平。

2013年科大讯飞车载降噪产品和国际竞争对手效果对比

2.声源定位(Source Localization)

现实中,声源的位置是不断变化的,这对于麦克风收音来说,是个障碍。麦克风阵列则可以进行声源定位,声源定位技术是指使用麦克风阵列来计算目标说话人的角度和距离,从而实现对目标说话人的跟踪以及后续的语音定向拾取,是人机交互、音视频会议等领域非常重要的前处理技术。所以麦克风阵列技术不限制说话人的运动,不需要移动位置以改变其接收方向,具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点,因而成为智能语音处理系统中捕捉说话人语音的重要手段。

混响产生原因示意图

3.去混响(Dereverberation)

一般我们听音乐时,希望有混响的效果,这是听觉上的一种享受。合适的混响会使得声音圆润动听、富有感染力。混响(Reverberation)现象指的是声波在室内传播时,要被墙壁、天花板、地板等障碍物形成反射声,并和直达声形成叠加,这种现象称为混响。

但是,混响现象对于识别就没有什么好处了。由于混响则会使得不同步的语音相互叠加,带来了音素的交叠掩蔽效应(Phoneme Overlap Effect),从而严重影响语音识别效果。

影响语音识别的部分一般是晚期混响部分,所以去混响的主要工作重点是放在如何去除晚期混响上面,多年来,去混响技术抑制是业界研究的热点和难点。利用麦克风阵列去混响的主要方法有以下几种:

(1)基于盲语音增强的方法(Blind signal enhancement approach),即将混响信号作为普通的加性噪声信号,在这个上面应用语音增强算法。

(2)基于波束形成的方法(Beamforming based approach),通过将多麦克风对收集的信号进行加权相加,在目标信号的方向形成一个拾音波束,同时衰减来自其他方向的反射声。

(3)基于逆滤波的方法(An inverse filtering approach),通过麦克风阵列估计房间的房间冲击响应(Room Impulse Response, RIR),设计重构滤波器来补偿来消除混响。

现在科大讯飞实现的基于麦克风阵列的去混响技术能很好的对房间的混响情况进行自适应的估计,从而很好的进行纯净信号的还原,显著的提升了语音听感和识别效果,在测试对比中,多种混响时间下识别效果接近手机近讲水平。

混响语音信号频谱

经过去混响后的语音信号频谱

4.声源信号提取(分离)

家里人说话太多,DingDong听谁的呢。这个时候就需要DingDong聪明的辨别出哪个声音才是指令。而麦克风阵列可以实现声源信号提取,声源信号的提取就是从多个声音信号中提取出目标信号,声源信号分离技术则是将需要将多个混合声音全部提取出来。

通过麦克风阵列波束形成做语音提取和分离

利用麦克风阵列做信号的提取和分离主要有以下几种方式:

(1)基于波束形成的方法,即通过向不同方向的声源分别形成拾音波束,并且抑制其他方向的声音,来进行语音提取或分离;

(2)基于传统的盲源信号分离(Blind Source Separation)的方法进行,主要包括主成分分析(Principal Component Analysis,PCA)基于独立成分分析(Independent Component Analysis,ICA)的方法。

当下的麦克风阵列

麦克风阵列技术虽然已经可以达到相当的技术水平,但是总体上还是存在一些问题的,比如当麦克风和信号源距离太远时(比如10m、20m距离),录制信号的信噪比会很低,算法处理难度很大;对于便携设备来说,受设备尺寸以及功耗的限制,麦克风的个数不能太多,阵列尺寸也不能太大。而分布式麦克风阵列技术则是解决当前问题的一个可能途径。所谓分布式阵列就是将子阵元或子阵列布局到更大的范围内,相互之间通过有线或者无线的方式进行数据的交换和共享,并在此基础上进行广义上的声源定位、波束形成等技术实现信号处理。

相对于目前集中式的麦克风阵列,分布式阵列的优势也是非常明显的。首先分布式麦克风阵列(尤其无线传输)的尺寸的限制就不存在了;另外,阵列的节点可以覆盖很大的面积——总会有一个阵列的节点距离声源很近,录音信噪比大幅度提升,算法处理难度也会降低,总体的信号处理的效果也会有非常显著的提升,因此分布式阵列有可能是未来智能家居和会议系统中的主流方案。目前科大讯飞已经开始了相关技术研究的布局工作。

在万物互联的今天,麦克风阵列技术已经深刻的走进了我们的日常生活。在智能车载、智能家居、机器人、可穿戴设备等应用热潮正兴起的时代,语音交互由于其便捷性,成了人机交互入口的第一选择,麦克风阵列自然也成为其中非常重要的前端技术。

在美国当地时间2016年9月13日,国际多通道语音分离和识别大赛(CHiME)组委会在美国旧金山Google公司揭晓了第四届CHiME-4的大赛结果,在公布结果之前,我们先来看看这个CHiME是什么?CHiME(Computational Hearing in Multisource Environments)始办于2011年,由法国计算机科学与自动化研究所、英国谢菲尔德大学、美国三菱电子研究实验室等知名研究机构所发起,比赛的目的是希望学术界和工业届针对高噪声和混响等现象影响下的实际场景提出全新的语音识别解决方案,以进一步提升语音识别的实用性和普适性,属于国际语音识别评测中的高难度比赛。

今年科大讯飞首次参加该项赛事,通过和中国科学技术大学杜俊教授团队、西北工业大学陈景东教授、佐治亚理工学院李锦辉教授等国内外知名专家的深入合作,斩获全部三个项目的桂冠并大幅刷新了各项目的历史最好记录三个项目分别是六麦克风、双麦克风和单麦克风场景下的语音分离和英文识别任务。虽然比赛的语种是英文,但无论中文还是英文,在语音技术上是相通的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 麦克风阵列
    +关注

    关注

    4

    文章

    23

    浏览量

    14063
  • 科大讯飞
    +关注

    关注

    19

    文章

    789

    浏览量

    61179
收藏 人收藏

    评论

    相关推荐

    MEMS麦克风技术和专利侵权风险分析

    中国初创企业(芯奥微、敏芯),所以楼氏电子的市场份额将继续下滑。MEMS麦克风厂商们都在研发创新的技术和制造解决方案,并及时申请专利来保护自己的发明。苹果iPhone6中的MEMS麦克风
    发表于 05-15 15:17

    为什么需要麦克风阵列

    其他结构形式的麦克风阵列,比如分布式阵列。多个麦克风阵列之间的成本差异现在正在变小,估计明年的成本就会相差不大。这是趋势,新兴的
    发表于 07-28 14:25

    科普麦克风阵列原理

    1 麦克风阵列麦克风阵列,是一组位于空间不同位置的全向麦克风按一定的形状规则布置形成的阵列,是对
    发表于 07-28 14:28

    麦克风阵列介绍

    1 麦克风阵列麦克风阵列,是一组位于空间不同位置的全向麦克风按一定的形状规则布置形成的阵列,是对
    发表于 08-08 18:43

    麦克风阵列 仅有两个麦克风,会不会不够用?

    麦克风阵列麦克风只有2个,带来的直接优势是成本低很多。同时,它小巧的构型决定它的应用也更为灵活。双麦克风阵列,顾名思义在录音系统上只使用
    发表于 08-08 18:44

    全球量产麦克风阵列的阵型技术盘点

    以及分布式阵列。但是由于这些特殊阵列的产品目前销量还较小,在市场上的影响还很小。为何不同产品的麦克风阵列差异如此大?从上面的盘点可以看出,A
    发表于 08-08 18:55

    汽车 麦克风阵列技术进行详述

    概述 我们之前介绍过语音识别技术(ASR),随着ASR的逐步成熟,麦克风阵列也逐步得到重用。尤其在汽车里,空间有限,便于声音的近场定位,而麦克风的布线可以很方便和很规则,便于实现成
    发表于 08-10 14:30

    基于麦克风阵列的语音增强技术及应用

    麦克风阵列进行语音处理的方法可以提高信噪比,解决环境噪声,回声和混响引起的语音识别性能降低的问题。
    发表于 03-29 10:54 94次下载

    麦克风阵列波束成形

    所有MEMS麦克风都具有全向拾音响应,也就是能够均等地响应来自四面八方的声音。多个麦克风可以配置成阵列,形成定向响应或波束场型。经过设计,波束成形麦克风
    发表于 04-24 14:13 165次下载
    <b class='flag-5'>麦克风</b><b class='flag-5'>阵列</b>波束成形

    麦克风阵列原理与应用

    麦克风阵列原理与应用
    发表于 08-08 11:43 63次下载

    科大讯飞麦克风阵列模块 麦克风设计参考手册

    科大讯飞麦克风阵列模块 麦克风设计参考手册
    发表于 11-04 09:47 205次下载

    沐渥科技详解麦克风阵列的原理、分类及作用

    从字面上看,麦克风阵列指的就是麦克风的排列。也就是将一定数目的麦克风按照一定的规则形状进行布局形成的阵列,用来对声音信号空间特性的传播进行采
    的头像 发表于 07-11 17:22 1613次阅读
    沐渥科技详解<b class='flag-5'>麦克风</b><b class='flag-5'>阵列</b>的原理、分类及作用

    基于麦克风阵列的声源定位技术

    电子发烧友网站提供《基于麦克风阵列的声源定位技术.pdf》资料免费下载
    发表于 10-19 11:39 13次下载
    基于<b class='flag-5'>麦克风</b><b class='flag-5'>阵列</b>的声源定位<b class='flag-5'>技术</b>

    一文全了解麦克风阵列

    什么是麦克风阵列? 想象一下一个小型音响部队在你面前,它们站成一排,用不同的麦克风捕捉声音。这就是麦克风阵列的基本概念。
    的头像 发表于 09-03 16:03 1087次阅读
    一文全了解<b class='flag-5'>麦克风</b><b class='flag-5'>阵列</b>

    主流麦克风阵列有哪些?

    麦克风阵列在HiFi音频解决方案中的重要性体现在它对音质提升的全面贡献。通过精准的声源定位、噪声抑制、空间感增强和智能处理,麦克风阵列为HiFi音频系统提供了卓越的声音采集和再现能力,
    的头像 发表于 10-08 20:52 521次阅读
    <b class='flag-5'>主流</b>的<b class='flag-5'>麦克风</b><b class='flag-5'>阵列</b>有哪些?