0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于五麦克风环形阵列的分析

讯飞开放平台 来源:djl 2019-10-08 10:46 次阅读

讯飞五麦震撼来袭

科大讯飞是国际上最早开始研究远场语音识别技术的机构之一,也是国内唯一具备成熟解决方案的厂商。自2015年3月和8月,讯飞相继对外发布四麦、二麦麦克风阵列解决方案。今天在深圳阿基米互联网公社举办的“讯飞核心技术开发日——麦入云端,引领智能交互新主义”沙龙活动中,更重磅发布了打破语音交互瓶颈的利器——4+1环形五麦克风阵列,再次引领智能交互新主义!

在科大讯飞15年底年度发布会上,在场的3000余人见证了这样的一场人机互动:演示人员在5米开外,用声音操控叮咚音箱,完成了一系列高难度的订票任务,引来台下阵阵惊叹——现场那么嘈杂,叮咚音箱却如此“听话”,要让叮咚音箱听懂这么多声音,而且具备远场识别的功能,它必须听的到,而且要听的更加清晰,人类可以带上助听器,机器需要什么呢?【麦克风阵列】就充当了助听器这样的角色。可以说,麦克风阵列犹如远场识别的心脏。有了这颗“机器之心”, 在远场场景中,就可以一举解决在了远场识别中遇到的背景噪声、其他人声干扰、回声、混响等核心问题。

图:“麦入云端,引领智能交互新主义”沙龙活动现场

定义人机交互的标准

讯飞开放平台副总经理马汉君进行了开场演讲,马汉君以”科大讯飞——人工智能引导者“为主题系统地介绍了人工智能的起源和发展,以及讯飞在人工智能领域里的最新研究成果和在人工智能+IOT时代的愿景和目标,并在演讲的最后详细的阐述了于去年底发布的人机交互界面——AIUI。

图:讯飞开放平台副总经理马汉君

马汉君说:“人工智能将助力IOT时代的蓬勃兴起,而科大讯飞的愿景则是加速这一过程。当前讯飞的自然开放交互平台上的应用已经超过90000个,连接终端超过8.8亿台。接下来讯飞将通过深度神经网络与大数据的结合,实现人工智能从“能听会说”到“能理解会思考”的突破。2014年8月,科大讯飞成为中国首个人工智能项目“类人答题机器人”的牵头单位,正式启动超脑计划。未来,讯飞超脑将能参加高考甚至取得“一本”的成绩。

在2015年,讯飞发布了AIUI,这是一个智能硬件量身定制了智能交互方案,重新定义了万物互联时代人机语音交互标准,具备了远场降噪、方言识别、语音纠错、多轮对话等功能。通过统一接口、开放的服务扩展、灵活的能力搭配实现人机交互与产品体验的结合,科大讯飞希望和合作伙伴一起,用人工智能改变世界。

智能交互,与声俱来

讯飞开放平台智能硬件产品总监张良春则从人机交互的三大痛点谈起,介绍了讯飞在这些问题的看法以及解决之道。“咬耳朵”不是智能交互,让机器人可以远场对话,需要使用麦克风阵列。现在讯飞推出有最新的环形五麦克风阵列,远场拾音距离可达5米。相比以往线性麦克风单维180°覆盖,环形五麦是360°全平面拾音角度,而且去噪效果更好,抗环境噪音的能力更强。

总的来说五麦麦克风阵列功能特性包括:二维空间拾音、抗噪能力增强、远距拾取音频、支持连续唤醒、支持回声消除、支持语音打断。麦克风阵列模块优点是迅速集成,缺点成本较高,适合小批量。所以讯飞也可以提供麦克风软核方案,包括算法SDK、录音板、加密芯片和构型说明。目前软核方案有单麦软核、双麦软核、四麦线性软核、环形五麦软核和环形七麦软核。环形七麦支持5~7米拾音距离、360°声源定位、±10°声源定位精度,阵列录入的音频信噪比更高。

图:讯飞开放平台智能硬件产品总监张良春

在演讲的中,张良春还风趣的套用了周星驰电影国产凌凌漆中的一个桥段:咱们的产品只要一开口说话,无论在哪里,都像黑暗中的一只萤火虫,那样的鲜明,那样的出众……

干货泥泞的麦克风阵列技术剖析

除了邀请讯飞开放平台的相关同事,此次发布会还特意从讯飞研究院邀请了信号处理领域的技术大牛王海坤博士。而王博士的发言无疑让此次本便干货满满发布会变得更加泥泞。王博士从信号与信号声学处理谈起,全面的剖析了讯飞的麦克风阵列与回声消除技术。

“噪声、混响、干扰和回声是声学信号处理需要解决的问题,而这些问题的解决离不开麦克风阵列。讯飞采用声源定位技术,利用麦克风阵列用基于TDOA(到达时间差)计算声源距离阵列的角度和距离,实现对目标声源的跟踪。再通过波束形成技术,即在期望方向上有效地形成一个波束,仅拾取波束的信号,从而达到同时提取声源和抑制噪声的目的。对于混响,则使用麦克风阵列+深度学习,实现有效的混响处理“。

图:讯飞研究院王海坤

“科大讯飞的回声消除技术更是达到国际顶尖水平,利用自适应滤波方法估计回声路径和利用参考信号求得麦克风拾取的喇叭声音,并将其减去。通过这一系列的技术,讯飞麦克风阵列实现了优异的声学信号处理,确保了良好的用户体验”。

智能硬件客,共享语音云

发布会最后做压轴演讲的,是讯飞开放平台智能硬件商务总监汤熙,汤熙以“生活不止眼前的苟且,还有诗和远方的田野”生动开场,着重介绍了开发者获取讯飞开放平台相关能力的一套流程。

图:讯飞开放平台智能硬件商务总监汤熙

汤熙最后表示:如果你确定与讯飞合作,讯飞将提供深入对接的全套服务。我们在深圳、北京、合肥都有支持团队,除了技术支持+商务本地化服务外,讯飞还提供包括资本服务、宣传服务、渠道服务等多种服务。我们希望在做好服务的同时,陪伴大家共同成长。讯飞会不断把核心技术做好,产品打磨好,把本地支持做好,只有这样才能陪伴大家往前走。讯飞也许不够完美,但是完美的讯飞需要大家一起缔造。

麦克风犹如远场识别的心脏和引擎,在其基础上,远场识别技术的远距离、高识别率支撑,现在用户在以家庭为单位的活动范围内,可以通过语音轻松操控家里的一切智能硬件设备,推而广之,搭载远场识别的智能硬件产品将无限扩大适用范围和应用场景。未来,科大讯飞将依靠自身强大的人工智能科研实力与优质产品,更具创造性地去改变世界,让人们的生活更加美好。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 助听器
    +关注

    关注

    18

    文章

    156

    浏览量

    40083
  • 人工智能
    +关注

    关注

    1781

    文章

    44933

    浏览量

    232357
收藏 人收藏

    评论

    相关推荐

    什么是AI麦克风阵列解决方案?

    什么是AI麦克风阵列解决方案? 想象一下,你站在一个音乐会的舞台上,周围有一群超级聪明的小助手,他们每个人手里拿着一只麦克风,分散在舞台的各个角落。这些小助手不仅能听到你的声音,还能帮你把声音变得更清晰,甚至能告诉你观众的欢呼
    的头像 发表于 06-14 16:19 196次阅读
    什么是AI<b class='flag-5'>麦克风</b><b class='flag-5'>阵列</b>解决方案?

    CYW20829 PDM可以支持麦克风麦克风是否可以支持2.3公里的长距离?

    CYW20829 PDM 可以支持麦克风麦克风是否可以支持 2.3 公里的长距离? 是否有参考设计/应用说明 为什么需要 ULL 和 ACL 这两个功能,因为 ULL 轮询间隔比 ACL 7.5ms 快 1 毫秒。 谢谢!
    发表于 05-23 07:28

    麦克风阵列解决方案

    飞腾云XMOS AI麦克风阵列解决方案不仅是技术上的进步,也是通往智能交互未来的一大步。
    的头像 发表于 05-16 16:00 273次阅读

    是否可以把STM32F407VG板子上的麦克风屏蔽了,外接自己的两个PDM麦克风

    请问是否可以把STM32F4DISCOVERY板子上的麦克风屏蔽了,外接自己的两个PDM麦克风
    发表于 04-03 07:30

    麦克风阵列双通道降噪拾音模组A-59

    麦克风模组
    深圳德宇科技有限公司
    发布于 :2024年03月29日 10:23:11

    STM32接入PC后能枚举出来麦克风设备,但是开始录音后无数据,为什么?

    使用STM32F4做USB 麦克风硬件: STM32F411 + MEMS数字麦克风(输出PDM数据)+ USB接口工作流程:STM32作为USB Aduio Deice 与PC连接,并通过I2S
    发表于 03-18 08:25

    求助,关于EVAL-ADAU1761Z和数字麦克风问题

    手上有一个音频编解码板EVAL-ADAU1761Z。现在有一些问题请教大家:当它连接到我们的测试PCB(板上只有一个数字麦克风前置放大器)。我们的测试芯片的输出是一个比特数据流。因为只有一个数
    发表于 11-30 06:44

    麦克风阵列波束成形应用案例

    电子发烧友网站提供《麦克风阵列波束成形应用案例.pdf》资料免费下载
    发表于 11-23 11:34 4次下载
    <b class='flag-5'>麦克风</b><b class='flag-5'>阵列</b>波束成形应用案例

    基于麦克风阵列的声源定位技术

    电子发烧友网站提供《基于麦克风阵列的声源定位技术.pdf》资料免费下载
    发表于 10-19 11:39 6次下载
    基于<b class='flag-5'>麦克风</b><b class='flag-5'>阵列</b>的声源定位技术

    麦克风经常啸叫,学会这几招轻松避免

    当唱歌时遇上啸叫是很痛苦的经历,本来好好地沉醉在音乐的海洋里,突然麦克风一阵乱叫,即使有再大的兴致也烟消云散,如果有其他人在场出现这种情况,演唱者还会特别尴尬,在会议时出现啸叫的现象也会让场面一度
    发表于 10-11 10:54

    使用晶体管的驻极体麦克风放大器电路

      该驻极体麦克风放大器电路采用普通电子元件设计。该麦克风放大器电路使用驻极体麦克风极头,但可以是动圈麦克风,其电阻较低。本电路要求电源电压在5到10伏之间,建议使用9伏直流电源电压。
    发表于 09-08 15:47

    麦克风阵列声源定位追踪模组AR-1105

    麦克风模组
    深圳德宇科技有限公司
    发布于 :2023年09月01日 17:12:38

    使用LM387制作的动圈麦克风前置放大器电路

      动圈麦克风前置放大器电路可以使用LM387双运算放大器集成电路制成。输入阻抗对应于47k,它几乎完全取决于R1。如果您希望连接具有不同值的动圈麦克风,可以更改电阻R1。动圈麦克风前置放大器放大
    发表于 08-31 18:18

    使用NuMicro M487上的SPI或I2S来捕捉PDM麦克风数据

    应用程序 : 这个 USB 音频类示例代码记录来自 SPI 或 I2S 上的 PDM 麦克风的声音, 当微控制器(MCU) 没有专用接口时, 它会连接到 SPI 或 I2S 上 。 示例代码包括将
    发表于 08-29 07:36

    请问NUC505支持数字麦克风吗?

    NUC505支持数字麦克风吗?
    发表于 08-28 07:09