0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

回顾声智科技发布全新的DSP低功耗语音交互方案参与中国用户大会

声智科技 来源:djl 作者:声智科技 2019-08-12 17:29 次阅读

一年一度的Cadence CDNLive中国用户大会2018于8月10日在上海浦东嘉里大酒店开幕,作为Cadence的战略级合作伙伴,声智科技带着全新的DSP低功耗语音交互方案出席了此次大会。

CDNLive大会是由Cadence公司举办的一年一度的全球巡回用户大会。从今年4月由美国硅谷伊始,覆盖德国、日本、***、印度、以色列等七大地区和国家。大会以“联结、分享、启发”为主题,行业巨头、技术用户、业界顶尖开发者与业界专家都将聚集于此,共同分享高阶工艺芯片、复杂SoC和系统设计的技术和理念,为行业的发展提供灵感和启发。对于科技行业来说,这个集会可谓是一年一度最大的盛典。

2017年声智科技与Cadence建立了战略合作关系,开始为CadenceTensilicaDSP系列产品研发设计低功耗远场智能语音交互解决方案。本次Cadence CDNLive中国用户大会上,声智科技展示了基于Cadence Tensilica Fusion和HiFi DSP设计的融合远场语音交互和远场实时通话技术的SoundAI Voice Kit智能语音交互系统。

融合远场语音交互和远场实时通话技术的SoundAI Voice Kit(以下简称SVK)是一款为手机、智能机器人、智能电视、机顶盒、机顶盒等消费电子产品和IOT产品提供低功耗的远场语音唤醒,语音识别,语音控制,语音搜索,远场声纹识别,远场实时通话(VoIP)等功能的理想软件解决方案。

(1)满足低功耗需求

随着亚马逊Echo、谷歌Google Home,阿里天猫精灵、小米小爱同学等产品在市场上大获成功,支持远场语音交互的智能设备越来越普及。远场智能语音交互势必是未来人机交互的新趋势。智能语音交互必然会推动消费电子品、物联网的革命,包括如汽车、家用设备,手机以及可穿戴设备。然而,耗能过高的困扰一直是制约物联网发展。

本次大会推出的SVK智能语音交互系统提供的远场语音唤醒算法,具有低功耗的特点,可以保证SoC和系统成本,也可以满足家居和移动场景的不同需求。该算法计算量少,计算复杂度低,占CPU内存小,但是语音交互的顺畅度不打折。

该算法搭载了最新的Voice Activity Detection技术,可拾取环境语音以检测和响应唤醒词或触发命令,通过关键字检测支持低功耗实时监听,实现低功耗远场语音唤醒功能。而且针对可能出现的多线程同时工作场景,也可以随时唤醒识别,不影响人机交流自然顺畅的体验,只为语音交互带来方便,不增加重量。在手机上应用,可实现锁屏唤醒、多任务唤醒、远场声纹唤醒等功能。

该远场语音唤醒算法可实现五米之内95%以上的唤醒率,支持Duel-wake(双名唤醒)、Free-cut(随时打断、随时唤醒)、One-shot(一句连控)的功能。目前,小米、百度、阿里、腾讯、华为、联想、猎豹移动等公司均采用声智科技提供的远场语音唤醒技术。

Dual-wake(双名唤醒),即唤醒词不再是单一的一个,设备可以拥有两个名字,使用任意一个名字都可以将其唤醒并进行无差别的操作,这样的设计与改进为设备后期功能扩展以及实现智能家电之间的联动留下了空间。

Free-cut(随时打断、随时唤醒)技术可以让设备任意时刻终止当前任务,立即响应新的用户需求,这就实现了连续唤醒执行新的命令,而无需等待上一任务完成后响应,随叫随应。

One-shot(一句连控),采用“唤醒词+语音语义识别”一体化方式,实现唤醒词与语音操控之间无缝对接,用户叫了设备的名字后无需等待设备应答就可以直接说出命令,无需等待设备回应“诶”、“我在”等之后才能说出命令,响应速度更快,更加符合人类语音交互习惯。

(2)匹配复杂场景

随着智能语音设备应用场景的增加,由近场语音交互过渡到远场语音交互,场景中的噪声种类越来越多,越来越复杂,对于语音交互的要求也越来越高。针对可能出现的极端噪声场景,本次推出的SoundAI Voice Kit智能语音交互系统也进行了定制优化。

集成通话降噪、混响抑制、回声抵消、噪声抑制、波束形成、增益控制等噪声抑制技术,针对远场语音交互所处的复杂应用场景,定制了OpenAEC算法,可以解决弱参考信号或者无参考信号等更为复杂场景的回声抵消(自噪声抑制)问题,可实现更加精准的唤醒。

同时搭载了针对智能家居、办公环境、车载等场景的抗强噪唤醒算法(AKS技术),保证在噪声环境中,也实现精准的远场语音唤醒。在车载环境中,针对主副驾驶的方向性降噪问题,通过麦克风阵列波束成型技术在主方向语音不失真的前提下,有效去除空调、胎噪等平稳噪声,平稳噪声抑制量大于30dB。

并在保护主方向语音的同时,去除环境中的语音、车载娱乐设施等非稳态噪声的干扰。其中非稳态噪声抑制量大于20dB,在噪音环境下可以大幅提升远场语音唤醒和识别率。解决行车过程中,主驾驶与智能语音设备语音交互易受干扰的问题,确保准确识别主驾驶方向的指令,抑制其他方向噪声。

针对家庭场景下,易出现的大电视噪声、音响噪声等非稳态噪声,声智推出了

家庭非稳态噪声抑制技术、垂直抗强噪识别技术,专门匹配相应场景,带来更出色的远场交互体验,无惧环境,想说就说,声随心动,保证远场语音交互的完美体验。

(3)快速开发集成

声智科技推出的融合远场语音交互和远场实时通话技术的SoundAI Voice Kit是众多audio/voice/speech软硬件合作伙伴生态系统的重要支撑,通过提供包括唤醒、降噪、ASR、NLP在内的领先的语音交互技术,帮助用户快速打造自己的硬件产品,更加易于集成,易于开发,易于扩展,更安全,更自由。

一直以来,DSP芯片具有大规模集成性、稳定性好、精度高、可嵌入性、接口和集成方便等特点,而且相较于通用芯片(AP芯片),价格更具优势。随着智能电子消费品、IOT产品越来越多的涌现,目前市场还没有专门的语音芯片应用到智能语音设备中,还没有经过市场验证。

目前更多的还是采用通用芯片(AP芯片/平板芯片等)+Codec芯片/DSP芯片等组合的方式。DSP芯片通过对数字信号进行处理,包括回声消除、噪声抑制、语音降噪/增强等,使语音便于后端的语音识别,再由通用芯片进行处理传输到云端提供语音处理的计算力支持。

人工智能的大爆发给消费电子产品和IOT设备的变革塑造了更多的可能性。此次出席Cadence大会,声智科技带来的全新的融合远场语音交互和远场实时通话技术的SoundAI Voice Kit智能语音交互系统,将更好的赋能客户的智能硬件产品快速的落地,拥有更精准的、更符合人性习惯的远场语音交互能力与智能语音交互体验。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    38

    文章

    1710

    浏览量

    112484
  • 智能机器人
    +关注

    关注

    17

    文章

    862

    浏览量

    82157
  • 语音交互
    +关注

    关注

    3

    文章

    282

    浏览量

    27962
收藏 人收藏

    评论

    相关推荐

    BLE低功耗蓝牙模块在答题器中的应用方案

    1、背景介绍答题器广泛应用于课堂、会议、培训等场合,用于实时采集和反馈参与者的答题信息。随着物联网技术的发展,传统的红外或有线答题器逐渐向更高效、更低功耗的方向发展。蓝牙技术,尤其是低功耗蓝牙
    的头像 发表于 11-04 16:25 72次阅读
    BLE<b class='flag-5'>低功耗</b>蓝牙模块在答题器中的应用<b class='flag-5'>方案</b>

    高燃回顾|第三届OpenHarmony技术大会精彩瞬间

    卓越开源人才 为全球操作系统的技术创新持续贡献中国力量 立即点击视频回顾大会精彩瞬间 ↓↓↓ 技术引领筑生态,万物智联创未来 让我们期待下一次的相聚!
    发表于 10-16 18:47

    2024 KiCon Asia KiCad 用户大会

    !我们希望可以通过这次会议,建立起 KiCad 社区与中国用户的桥梁,并提供一个平台,让中国用户用户之间可以更高效地交流,同时为中国
    发表于 09-24 09:43

    2024 KiCon Asia KiCad 用户大会 预约报名

    KiCad 发展做出贡献。 当然,我们也欢迎您来到 KiCon,吐槽 KiCad 的 Bug 和不足之处!我们希望可以通过这次会议,建立起 KiCad 社区与中国用户的桥梁,并提供一个平台,让中国用户
    发表于 09-14 10:55

    ES9038Q2M 32位立体低功耗音频DAC英文手册

    电子发烧友网站提供《ES9038Q2M 32位立体低功耗音频DAC英文手册.pdf》资料免费下载
    发表于 08-09 11:44 3次下载

    智能炒菜机OTP语音提示芯片赋予全新交互方式

    OTP语音提示芯片为智能炒菜机带来全新交互方式,具备音质出色、稳定可靠、灵活可定制等特点,实现开机、烹饪、操作及故障提示,提升用户烹饪体验。NVD系列OTP语音芯片适合智能炒菜机应用,
    的头像 发表于 05-31 16:02 327次阅读

    深耕交互式人工智能领域,通科技为用户提供更加智能的解决方案

    的Voicecomm Brain技术,正引领着企业级用户走向全栈交互式人工智能解决方案的新纪元。 经过近二十年的持续研发,通科技已成为中国
    的头像 发表于 05-16 09:42 279次阅读

    OTP低功耗语音芯片的工作原理与产品特性

    OTP低功耗语音芯片的工作原理:在于其独特的电路设计以及先进的制程技术。该芯片采用了先进的低功耗设计策略,包括低漏电晶体管、动态电压调整以及智能休眠模式等,确保在保持高性能的同时实现低功耗
    的头像 发表于 04-30 08:06 535次阅读
    OTP<b class='flag-5'>低功耗</b><b class='flag-5'>语音</b>芯片的工作原理与产品特性

    基于唯创语音芯片的三大烟雾报警器语音方案

    在智能设备与物联网(IoT)技术的飞速发展中,语音播报功能的重要性日益凸显,已成为提升用户体验、实现人机交互的关键一环。本文将深入探讨三种创新性语音播报系统设计
    的头像 发表于 04-12 15:08 366次阅读
    基于唯创<b class='flag-5'>语音</b>芯片的三大烟雾报警器<b class='flag-5'>语音</b><b class='flag-5'>方案</b>

    通科技:Voicecomm Suites引领企业交互式人工智能新风尚

    创新,推出了Voicecomm Suites这一领先业界的解决方案,为企业级用户的信息交换和商业交互提供了智能化转型的强有力支持。 据了解,为实现解决方案的大规模部署及其在近似使用场景
    的头像 发表于 04-12 12:02 239次阅读

    芯原低功耗蓝牙整体IP解决方案已通过LE Audio全部功能认证

    2024年3月28日,中国上海——芯原股份 (芯原,股票代码:688521.SH) 今日宣布其低功耗蓝牙整体IP解决方案已全面支持蓝牙技术联盟 (Bluetooth SIG) 发布的L
    的头像 发表于 03-28 11:30 564次阅读

    聚芯启迪,智链飞跃|2024普迪飞中国用户大会成功举办

    2024年3月15日,2024普迪飞(PDF Solutions)首届中国用户大会在上海浦东成功举办,本次大会以“聚芯启迪,智链飞跃”为主题,旨在打通全行业沟通壁垒,碰撞出更多新思路。现场超200位
    发表于 03-21 16:40 341次阅读
    聚芯启迪,智链飞跃|2024普迪飞<b class='flag-5'>中国用户</b><b class='flag-5'>大会</b>成功举办

    软通动力参与华为中国合作伙伴大会2024精彩回顾

    精彩盘点·华为中国合作伙伴大会2024 3月14-15日,“华为中国合作伙伴大会2024”在深圳隆重举行。作为华为的重要合作伙伴和本次大会
    的头像 发表于 03-18 10:44 1011次阅读
    软通动力<b class='flag-5'>参与</b>华为<b class='flag-5'>中国</b>合作伙伴<b class='flag-5'>大会</b>2024精彩<b class='flag-5'>回顾</b>

    思必驰语音算法与芯片的完美结合 人机交互

    工智能人机语音交互解决方案,具有高性能、低功耗等特点。该芯片通过采用软硬融合的方法,使得TH1520具备快速赋予各类设备语音
    的头像 发表于 12-29 11:43 878次阅读
    思必驰<b class='flag-5'>语音</b>算法与芯片的完美结合 人机<b class='flag-5'>交互</b>

    离线语音识别技术:掌控未来的语音交互

    离线语音识别技术的核心优势在于其独立性和实时性。在没有网络连接的情况下,设备依然能够迅速识别用户语音指令,实现各种功能。这使得语音交互更加
    的头像 发表于 12-13 11:12 536次阅读
    离线<b class='flag-5'>语音</b>识别技术:掌控未来的<b class='flag-5'>语音</b><b class='flag-5'>交互</b>