0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于声智穿透式远场语音技术介绍

声智科技 来源:djl 作者:声智科技 2019-08-13 09:01 次阅读

2018年11月1日,腾讯全球合作伙伴大会,以“开放·共生”为主题,在南京开幕。声智科技联合创始人兼首席知识官常乐受邀出席,并与来自全球的科技、文化与商业领域数百位国际大咖和万名行业精英,以及腾讯微信、QQ、腾讯云、腾讯开放平台、腾讯企鹅号、腾讯应用宝、腾讯AI Lab、腾讯车联、腾讯自动驾驶、腾讯微瓴互联、腾讯动漫等业务条线的合作伙伴,共商未来人机互联战略布局与发展之道。

声智科技联合创始人兼首席知识官常乐表示:“未来,我们将置身于人工智能语音交互时代,继续朝着‘语音即搜索,语言即服务’方向演进。物理世界与数字世界的有机融合会进一步加速,日益形成更加智能化的万物互联的人机世界。实现这一美好智能图景的关键在于,实现智能语音交互在更多真实复杂场景中的应用与落地。声智科技,自2017年初成为腾讯人工智能生态合作伙伴以来,依托声智科技自主研发的软硬件一体的远场语音交互技术势能,先后为腾讯打造了腾讯智能音箱、智能车机系统以及全球首款王者荣耀智能机器人产品,助力腾讯深化在家居、车载和机器人三大领域的人工智能布局与落地。”

全球首创的穿透式远场语音交互解决方案

王者荣耀智能机器人,游戏人物战神吕布为原型,是国内首款人工智能与游戏结合的智能机器人。搭载声智科技为腾讯独家定制的全球首创的穿透式远场语音交互解决方案,采用全球首款人偶型音腔结构设计,由独立的人偶和底座两部分构成,底座装有旋转装置,人偶可以追随玩家用户的声源,并且旋转定位;通过独家的6麦环形倒置麦克风阵列(Inverse Array)设计,内置穿透式波达方向估计(Penetrated DOA),动态声场的回声消除(Vibrated AEC)等独家定制的AI声学算法,成就了具备“听”、“说”感知能力的AI游戏达人——王者荣耀智能机器人!在腾讯全球合作伙伴大会上,王者荣耀智能机器人惊艳亮相展区,为现场观众带来了真实不凡的语音交互体验。

(1)6麦环形倒置麦克风阵列(InverseArray)

为了战斗时,给游戏玩家身临其境的听觉享受,王者荣耀机器人将扬声器设置于人偶的头部。区别于常规智能语音设备(比如音箱、机顶盒)麦克风阵列置于顶端、扬声器位于底部的“上听下说”且“听说一体”的圆柱或立方体的中空音腔结构,王者荣耀智能机器人的麦克风阵列设计位置只能置于底座,从而形成独特的“下听上说”且“听说分离”的不规则非中空音腔结构。这样的结构设计,也给麦克风阵列的结构设计与声学AI算法适配带来了巨大的难度。

同时,为了让王者荣耀机器人可以随时定位玩家位置,底盘设置了旋转电机装置,电机极为靠近麦克风阵列,当人偶被唤醒后进行大角度旋转时,会产生电机噪音,影响麦克风阵列的准确拾音。

为此,声智科技为腾讯的王者荣耀机器人量身研制了“倒置麦克风阵列(Inverse Array)”技术。基于声智科技定制研发的6麦环形的倒置麦克风阵列,进一步加强麦克风阵列的声音信号处理能力,对抗人偶机器人对于麦克风阵列的遮挡,以及其产生的声反射和声衍射的干扰,有效抑制自噪声和其他外部噪音。在真实的环境中,王者荣耀智能机器人可拾取3-5米远场距离声音,并实现的360度全方位的语音唤醒与识别。

(2)穿透式波达方向估计(PenetratedDOA)

王者荣耀智能机器人独特的设计,使人偶身体处在麦克风阵列正上方,成为直接障碍物,形成了大量因不规则外形的人偶身体产生的声反射和声衍射,导致了多径传播情况的普遍发生,极大影响了王者荣耀智能机器人的准确定位功能。

为了应对这些结构性挑战,进一步加强麦克风阵列的声音信号处理,有效抑制自噪声和其他外部噪音,提高声源测向的准确度,声智科技最新研发了穿透式波达方向估计(Penetrated DOA)技术。即使在噪音干扰大,强混响,强反射面的条件下,王者荣耀智能机器人可实现360度全方位的测向,定位误差在10度以内,随时响应“主公”的呼唤。

(3)动态声场的回声消除(VibratedAEC)

传统智能音箱等产品的设计扬声器在底部,而王者荣耀智能机器人的扬声器位于头部两侧,一侧指向性的扬声器为全频段发声器件,承担主动发声功能,另一侧为低频共振被动膜片被动发声,以达到较佳的低音效果。而这样的特殊设计,导致位于扬声器垂直下方的环形麦克风阵列单元拾取到的扬声器系统自噪声直达声信号不一致,这无疑增大了语音唤醒与识别的难度。

而且,主动扬声器的声音会干扰麦克风阵列进行声源侧向,进一步影响人偶旋转角度的准确性。同时,旋转装置的电机,极为靠近麦克风阵列,当人偶被唤醒后进行大角度旋转时,产生的电机噪音影响麦克风阵列的拾音。

为此,声智科技研发了最新的动态声场回声消除(Vibrated AEC)技术,可有效提升音乐状态或语音合成(TTS)状态下的唤醒率,以及在5米内的噪音环境下的远场语音唤醒和识别率。搭配声智科技自主知识产权的混响消除、宽场景高灵敏语音唤醒等专属声学AI算法,可在保护主方向语音不失真的前提下,去除环境中的语音等非稳态噪声以及空调等其他平稳噪声的干扰,自适应计算混响的能量,予以抑制,去除由于房间混响造成的语音拖尾,增强语音清晰度,同时解决弱参考信号或者无参考信号等复杂场景中的回声抵消(自噪声抑制)问题,在双工语音交互(Double Talk)的情况下仍然鲁棒。

所以,王者荣耀智能机器人在保证高唤醒率的同时,能有力降低误唤醒率,实现轻松唤醒,随时打断、随时唤醒,无惧环境,想说就说,声随心动,为用户打造完美的远场语音交互的体验。

语音交互技术的创新,只有依托真实的场景,才能真正释放技术的潜能,发挥技术的应用价值,推动人工智能朝着普惠化方向发展,让更多人切实地感受到科技的智能、快捷与便利。声智科技,将继续坚持引领技术服务场景的创新路线,携手生态合作伙伴,为不同的垂直行业打造适配多元场景的远场语音交互系统方案。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    28231

    浏览量

    206614
  • 人工智能
    +关注

    关注

    1791

    文章

    46896

    浏览量

    237666
  • 语音交互
    +关注

    关注

    3

    文章

    283

    浏览量

    27986
收藏 人收藏

    评论

    相关推荐

    EVS103智能纯离线语音识别芯片介绍

    EVS103是一颗亚毫瓦级超低功耗面向带电池和便携产品,以及对功耗有严苛要求的各类产品推出的智能纯离线语音识别芯片。依托于POROSVOC在语音识别技术上的积累和算法的不断优化和创新
    的头像 发表于 11-11 11:34 168次阅读
    EVS103智能纯离线<b class='flag-5'>语音</b>识别芯片<b class='flag-5'>介绍</b>

    语音识别ic赋能烤箱,离线对话操控,引领智能厨房新体验

    智能烤箱融入语音识别技术,提升使用体验,实现便捷操作与智能反馈。NRK3502芯片支持离线识别,助力烤箱创新升级。未来,智能烤箱将成为家庭必备,开启智能厨房新篇章。
    的头像 发表于 11-05 10:30 120次阅读

    半导体激光器的特性

    人们通常将半导体激光器输出的光分布分别用近场与特性来描述。
    的头像 发表于 10-30 10:45 246次阅读
    半导体激光器的<b class='flag-5'>远</b><b class='flag-5'>场</b>特性

    请问有移动设备上用的2.1道的语音功放芯片吗?

    请问有移动设备上用的2.1道的语音功放芯片吗?前端是左右声道差分音频输入。电源电压 大概3~5V。
    发表于 10-15 07:54

    应用中的模拟麦克风和ADC系统

    电子发烧友网站提供《应用中的模拟麦克风和ADC系统.pdf》资料免费下载
    发表于 08-28 09:39 0次下载
    <b class='flag-5'>远</b><b class='flag-5'>场</b>应用中的模拟麦克风和ADC系统

    乐鑫声学前端算法:打造智能语音交互新体验,ESP32-S3 SOC技术方案

    随着人工智能技术的不断进步,智能语音设备正逐渐成为我们生活中不可或缺的一部分。然而,在嘈杂的现实环境中,如何实现清晰、准确的语音交互,一直是业界面临的一大挑战。今天,我们要介绍的是乐鑫
    的头像 发表于 08-03 08:04 796次阅读
    乐鑫声学前端算法:打造智能<b class='flag-5'>语音</b>交互新体验,ESP32-S3 SOC<b class='flag-5'>技术</b>方案

    如何使用双条结构改进窄脊高功率激光二极管角呢?

    在激光器芯片的设计和应用中,角度是一个重要的参数。它描述了激光器发出的光束在远离芯片后,其发散程度。
    的头像 发表于 05-01 10:53 597次阅读
    如何使用双条结构改进窄脊高功率激光二极管<b class='flag-5'>远</b><b class='flag-5'>场</b>角呢?

    语音芯片究竟如何写入语音?思泽科技为您详细解答

    在现代科技的发展中,语音芯片已经成为了我们生活中不可或缺的一部分。它可以被广泛应用于各种设备,如智能手机、平板电脑、智能家居等,为我们提供便捷的操作体验。那么,语音芯片究竟如何写入语音呢?思泽
    的头像 发表于 03-27 14:41 824次阅读
    <b class='flag-5'>语音</b>芯片究竟如何写入<b class='flag-5'>语音</b>?思泽<b class='flag-5'>远</b>科技为您详细解答

    思泽玩具语音芯片推荐:让孩子们更好地学习与玩耍

    在当今科技日新月异的时代,智能玩具已经成为了孩子们生活中不可或缺的一部分。而为了让这些智能玩具更加智能化、更具有互动性,玩具语音芯片应运而生。那么,如何为孩子选择一款合适的玩具语音芯片呢?思泽
    的头像 发表于 03-22 17:11 599次阅读
    思泽<b class='flag-5'>远</b>玩具<b class='flag-5'>语音</b>芯片推荐:让孩子们更好地学习与玩耍

    思泽语音芯片:让智能生活触手可及

    随着科技的飞速发展,人工智能已经逐渐走进我们的生活。在这个过程中,语音识别技术作为人工智能的重要分支,也得到了迅速的发展。今天,我们要介绍的就是一款在语音识别领域表现优秀的芯片——思泽
    的头像 发表于 03-19 15:20 414次阅读
    思泽<b class='flag-5'>远</b><b class='flag-5'>语音</b>芯片:让智能生活触手可及

    如何理解天线的近场和

    天线的近场和是指在天线周围的不同距离范围内的电磁场分布特性。
    的头像 发表于 02-22 15:46 8853次阅读
    如何理解天线的近场和<b class='flag-5'>远</b><b class='flag-5'>场</b>

    AI加速智能家居分布语音技术发展

    中的任何地方通过语音命令来控制智能设备,实现更具有体验性的居家生活。   什么是分布语音技术?   分布
    的头像 发表于 02-01 00:16 5768次阅读

    通信声明: 关于产品用途及安全合规性的澄清

    通信声明: 关于产品用途及安全合规性的澄清
    的头像 发表于 01-06 08:28 386次阅读
    移<b class='flag-5'>远</b>通信声明: <b class='flag-5'>关于</b>移<b class='flag-5'>远</b>产品用途及安全合规性的澄清

    语音数据集:推动AI语音技术的核心力量

    一、引言 随着人工智能的快速发展,语音技术作为人机交互的重要手段,正发挥着越来越重要的作用。而语音数据集则是推动AI语音技术的核心力量。本文
    的头像 发表于 12-12 11:32 677次阅读

    什么是光学中的近场和?二者的区别是什么?

    近场和在不同的光学范畴有不同的定义,需要加以区分。下面从菲涅尔数入手,通过菲涅尔数介绍二者的区别。
    的头像 发表于 12-11 09:44 5792次阅读
    什么是光学中的近场和<b class='flag-5'>远</b><b class='flag-5'>场</b>?二者的区别是什么?