0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

思必驰与各位巨头共话AI语音的前沿技术、落地应用及未来演变趋势

思必驰 来源:djl 作者:思必驰 2019-08-06 16:52 次阅读

随着人工智能物联网技术的发展,AI技术纷纷进行着商业化落地并快速升级。AI语音作为人机交互的主要方式之一备受关注,预计2019年中国智能语音市场规模将进一步增长,达到200亿元。

7月19日,由深圳湾主办的 WARE 2019第Ⅱ季 新硬件AI技术与应用峰会在深圳举行,该峰会汇聚了AI语音行业的各位大咖,共话AI语音的前沿技术、落地应用及未来演变趋势。

现场,思必驰CMO龙梦竹以”无微不至,智能小家电的AI攻势“为题进行了分享。

图:思必驰CMO龙梦竹

她表示,消费市场靠智能音箱打响了第一枪,目前全行业全品类也在逐渐+AI,硬件、服务、交互体验均在升级,去中心化趋势明显。

思必驰作为全链路语音技术方案的提供商,面对日渐发展的蓝海市场,感受到了技术需求的明显变化。例如,算法和算力作为原动力,推动着AI滚滚前行,5G时代的到来给予了人工智能更强大的计算空间,但是对于台灯、插座、耳机等以极简化的命令式交互为主的终端来讲,更轻快的能效体验成为需求。

一直以来,超高度的定制化是IOT产品企业的强需求,就此思必驰做深做透,结合个性化定制的需求,推出DUI开放平台,用户在语音技术、应用场景、对话逻辑、技能知识等方面均可自行定制,增强产品的个性化特征。

在这一过程中,对于智能小家电、智能穿戴类企业而言,除定制需求外,在特定场景下的功能、功耗、能效、响应速度等方面均有不同需求。龙梦竹表示,通过实际对接过程中反哺技术的更新,我们发现了一些“深藏不露”的技术热点。

全双工,进一步推进人机对话的演变。

从单轮对话到多轮对话,全双工技术进一步推进人机对话的演变,使其具备实时智能响应、智能打断、智能纠错、多轮交互等能力,源源不断的语音上行流和源源不断的下行流,支持机器听+说同时进行,具备智能决策的能力,能够判断噪音、指令、响应时间、响应信号等,并可通过语义分析判断语气词、无效词、可忽略的停顿等,具备一次唤醒、多次交互的能力。

龙梦竹表示,全双工语音技术的成熟应用让机器智能对话变得更流畅。但是,全双工尚未成熟到通用阶段,但在部分应用场景中已初见成效,例如在智能客服场景,以及命令式交互为主的智能设备,比如台灯、耳机、空调等,比如“你好小驰,空调开到,嗯,20度,不不不,25度吧。”。

分布式麦克风阵列方案的需求浮出水面。

当前,麦克风阵列技术在智能音箱市场中的应用已十分普遍,远场交互、声源定位、算法降噪等技术均优化了产品体验,例如,思必驰双麦、线性/环形4麦、线性/环形6麦等多款软硬一体化方案的市场应用已十分成熟。

但是,随着多品类智能终端产品在用户生活中涌现,“一呼百应”的情况常常发生,此时,对分布式麦克风阵列解决方案的需求便浮出水面。

分布式麦克风阵列可让多个非结构排列的无规则麦克风组成阵列系统,提供就近唤醒功能,相对于规则化的麦阵,功耗更低。同时,借助声纹识别技术,判断说话人身份,避免设备长时间处于工作状态,达到低功耗目的。

全屋智能,多设备联动唤醒机制十分必要。

例如,正面唤醒可以通过近距离交互方式,面对面地唤醒设备以避免多设备误唤醒;就近唤醒则利用声波到达设备的时间差,对同一唤醒词的多款设备进行空间计算,利用二级唤醒机制来唤醒距离用户最近的设备;语义选择会基于one-shot云+端混合识别技术,实现本地唤醒词和云端识别语义一体化,基于用户语义分析用户意图,以唤醒相应设备;多模态交互技术带来了多模态直视唤醒,模拟人与人眼神交互的特点,唤醒用户需要交互的设备。

这些深藏不露的技术热点,让语音交互在IOT中的应用更加流畅自然。

同时,面对智能小家电、智能穿戴产品对低功耗的需求,思必驰推出低功耗算法方案,能够让设备持续工作、随叫随到,让更多的小设备快速+AI。

思必驰低功耗算法方案将根据硬件结构评审和声学评估结果,结合产品应用场景,提供相应的单项/组合项算法方案,主要可分为一级低功耗唤醒,二级唤醒验证,三级声纹验证。

尤其是一级低功耗唤醒,根据设备的基础情况,我们还会提供更适合的算法方案,例如,针对台灯、插座、低端的儿童玩具等小型、单一功能设备,且仅存在完全的近场唤醒需求类的产品,小模型语音唤醒方案即可满足需求。但,对于耳机、手机、白电类等具备相对远场需求的产品,双麦远场唤醒方案则更为合适。

该低功耗算法方案同样具备超高的定制能力,例如唤醒词定制,根据产品的目标人群年龄特征、地域特征的口音定制,根据产品应用的车载、商场、骑行等场景的噪声环境定制,根据芯片选型、硬件设计等进行灵活组合与定制。

“算法+芯片”的深度融合,带来了整体性能的升级。

思必驰携手子公司深聪智能打造了低功耗AI语音芯片TH1520,通过软硬件协同设计、优化整合型专用芯片,算法+芯片深度融合的嵌入式系统,取代通用芯片+通用算法的解决方案,打造可编程、定制化专用型 AI 深度学习架构,取代目前第三方通用型架构。目前,该芯片正式进入产品对接测试阶段。

TH1520在处理远场以及复杂声场下的各项体验指标处于业界领先,支持离线识别,可全离线应用,而且功耗极低,待机状态功耗毫瓦级,全速工作功耗不大于百毫瓦,可用电池供电,使得便携和移动场景成为可能,片内存储亦可大幅节省成本和总体功耗。同时,算法+芯片的方案可进行快速移植与部署,将产品推向市场。

目前该方案可应用于智能耳机、智能手机、智能门锁、智能台灯等多款产品。思必驰也将不断优化技术方案,为更多IOT产品带来优质体验。

越是体积小巧的设备,对功耗性能、集成工艺的要求越高。思必驰解决方案软硬兼施,应对智能小家电的AI攻势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1781

    文章

    45068

    浏览量

    232454
  • 智能语音
    +关注

    关注

    10

    文章

    765

    浏览量

    48474
收藏 人收藏

    评论

    相关推荐

    OPPO XR探索暂停,涉及人员转岗至AI方向

    对于此事,OPPO回应称,他们坚信AI未来发展的关键技术,因此OPPO研究院将加强对AI软硬件创新等前沿技术的探索。同时,研究院专注于
    的头像 发表于 04-26 17:25 880次阅读

    高通在MWC 2024展示前沿技术和合作成果

    产品,还携手全球和中国合作伙伴共同展示了在连接、AI、汽车、XR、手机、5G Advanced、6G等领域的前沿技术和合作成果。
    的头像 发表于 02-29 09:49 350次阅读

    云原生技术前沿落地实践分论坛圆满举办

    12 月 16 日,2023 开放原子开发者大会【云原生技术前沿落地实践】分论坛在无锡成功举办。论坛将聚焦云原生的泛在化、Serverless 化以及智能化等前沿发展趋势,与一线
    的头像 发表于 12-22 09:20 756次阅读
    云原生<b class='flag-5'>技术前沿</b><b class='flag-5'>落地</b>实践分论坛圆满举办

    语音数据集:AI语音技术的灵魂

    一、引言 在人工智能领域,语音技术被誉为“未来人机交互的入口”,而语音数据集则是AI语音
    的头像 发表于 12-14 14:33 516次阅读

    语音数据集:推动AI语音技术的核心力量

    一、引言 随着人工智能的快速发展,语音技术作为人机交互的重要手段,正发挥着越来越重要的作用。而语音数据集则是推动AI语音
    的头像 发表于 12-12 11:32 395次阅读

    浅谈情感语音识别:技术发展与未来趋势

    一、引言 情感语音识别是一种新兴的人工智能技术,它通过分析人类语音中的情感信息,实现人机之间的情感交互。本文将探讨情感语音识别技术的发展历程
    的头像 发表于 11-30 11:06 455次阅读

    情感语音识别:技术前沿未来趋势

    一、引言 情感语音识别是当前人工智能领域的前沿技术,它通过分析人类语音中的情感信息,实现更加智能化和个性化的人机交互。本文将探讨情感语音识别技术
    的头像 发表于 11-28 18:35 344次阅读

    情感语音识别的现状与未来趋势

    情感语音识别是一种涉及多个学科领域的前沿技术,包括心理学、语言学、计算机科学等。它通过分析人类语音中的情感信息,实现更加智能化和个性化的人机交互。本文将探讨情感语音识别的现状与
    的头像 发表于 11-28 17:22 506次阅读

    情感语音识别:技术发展与未来趋势

    一、引言 情感语音识别是近年来人工智能领域的研究热点,它通过分析人类语音中的情感信息,实现更加智能化和个性化的人机交互。本文将探讨情感语音识别技术
    的头像 发表于 11-23 14:28 356次阅读

    情感语音识别:现状、挑战与未来趋势

    的现状、挑战与未来趋势。 二、情感语音识别的现状 技术发展:随着深度学习技术的不断进步,情感语音
    的头像 发表于 11-22 11:31 514次阅读

    技术筑生态 智联赢未来,第二届OpenHarmony技术大会圆满举行

    将与Eclipse基金会在中国无锡市签署合作协议,以OpenHarmony为标杆,开启我国开源项目国际合作的新篇章。 开放原子开源基金会理事长孙文龙现场致辞 聚焦前沿技术,OpenHarmony引领
    发表于 11-04 14:59

    技术筑生态,智联赢未来 第二届OpenHarmony技术大会即将在京启幕

    OpenHarmony操作系统的技术革新、分享阶段性技术成果,还将特邀全球开源操作系统技术领袖,行业前沿领域的实践专家、高校技术导师、众多开
    发表于 10-31 11:27

    基于深度学习的语音合成技术的进展与未来趋势

    近年来,深度学习技术语音合成领域取得了显著的进展。基于深度学习的语音合成技术能够生成更加自然、真实的语音,提高了用户体验。本文将介绍基于深
    的头像 发表于 09-16 14:48 666次阅读

    TMC2023 | 博观约取,厚积薄发,共话动力总成前沿技术

    ,对动力系统电动化与智能化创新技术和战略进行分享和研讨。华为数字能源智能电动产品线副总裁陈伟带来了《博观约取,厚积薄发》为主题的演讲,分享了对动力总成技术趋势的思考。 华为数字能源智能电动产品线副总裁陈伟 陈伟认为,以下三个方向
    的头像 发表于 07-14 18:20 518次阅读
    TMC2023 | 博观约取,厚积薄发,<b class='flag-5'>共话</b>动力总成<b class='flag-5'>前沿技术</b>

    2023智博会,分享全球“科技”成果、探索前沿科技、展望未来趋势

    2023智博会,分享全球“科技”成果、探索前沿科技、展望未来趋势
    的头像 发表于 07-06 08:47 530次阅读
    2023智博会,分享全球“科技”成果、探索<b class='flag-5'>前沿</b>科技、展望<b class='flag-5'>未来</b><b class='flag-5'>趋势</b>