0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云服务提供商的语音算法成为芯片的黑匣子

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2021-03-31 15:51 次阅读

在设计智能音箱和其他语音功能的设备,例如可穿戴设备、可听觉设备时,开发者面临的首要挑战是如何让麦克风准确有效地检测 “Alexa ”和 “Hey Google ”等唤醒词,以便在云端处理。

DSP Group推出支持语音的语音系统级芯片(SoC)DBM10时,EDN向该公司SmartVoice芯片的产品经理Yosi Brosh提出了这个问题。这款基于DSP和神经网络(NN)加速器的双核SoC,针对电池设备中的语音和传感器处理进行了优化,如可听、可穿戴设备、真正的无线立体声(TWS)耳机和智能家居遥控器等。

c240b858-9159-11eb-8b86-12bb97331649.png

上图:用于语音智能产品的DBM10芯片宣称的采用平台方式,具有全面的软件框架支持。

Brosh表示,像亚马逊网络服务(AWS)这样的云平台对在芯片上配置寄存器不感兴趣。相反,这些云服务关注的是语音算法如何高效检测唤醒词。Brosh说“他们希望算法能够检测到唤醒词,而不需要工程师花费大量时间研究和配置芯片上的寄存器。”

因此,DSP Group开发了一个API,使语音检测算法很容易集成到云服务中。他补充道;“在某种程度上,云服务提供商的语音算法成为芯片的黑匣子。”

通常的做法是,设备制造商发布带有麦克风设置的软件代码,并告诉算法提供商如何在麦克风驱动中集成算法。以DSP Group的DBM10芯片为例,它使用语音固件采集音频,使语音采集算法的集成变得高效简单。

DSP Group一直在与十几家云公司密切合作,其中包括阿里巴巴、亚马逊、百度、谷歌和三星,同时在其芯片上移植他们的语音算法。据Brosh介绍,该公司在某些情况下还提供一套完整的软件。

该芯片能够为系统设计人员提供简单的部署路径,Brosh表示,公司对运行在DBM10语音接口芯片上软件的支持一直提供到生产层面,“系统工程师不需要编写一行代码”。

这就是为什么DSP Group称其DBM10芯片为完整解决方案的原因。该SoC通过通用DSP和名为nNetLite的神经网络处理器对音频算法以及传感AI算法进行了优化。除此以外DSP Group还提供运行在Wi-Fi芯片上用于与DBM10芯片进行通信的额外驱动程序。

SoC还具有跨平台的工具链,支持所有常用的人工智能(AI)和机器学习(ML)框架,以简化算法部署。工程师们可以开发、训练和测试算法,然后将算法以标准格式保存,工具链会将其提取并创建一个图像,下载到SoC中。

上图:nNetLite编译器可以快速优化、修剪和部署任何框架的AI/ML模型到DBM10 SoC。

该SoC的外形尺寸很小,只有4平方毫米,可以进入像智能手表这样的极小设备。同样,在SoC的神经网络nNetLite引擎上运行的始终处于开启状态的wake word算法只消耗几微瓦的电能。
编辑:lyn

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音
    +关注

    关注

    3

    文章

    381

    浏览量

    37972
  • 算法
    +关注

    关注

    23

    文章

    4587

    浏览量

    92484
  • 云服务
    +关注

    关注

    0

    文章

    803

    浏览量

    38850

原文标题:简化云服务的语音检测算法部署

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    挑选海外服务提供商攻略

    挑选海外服务提供商是一个综合考量多方面因素的过程。在明确自身需求的基础上,可以从性能、成本、安全、服务等多个维度进行全面评估。
    的头像 发表于 10-15 18:20 126次阅读

    超享服务器是什么意思?是免费的吗

    超享服务器是一种基于计算技术,提供高性能、高可靠性和可扩展性的虚拟化服务服务。它是通过虚拟
    的头像 发表于 10-08 10:17 104次阅读

    如何理解计算?

    的问题。 **提供高性能的计算资源:**服务提供商通常会部署大规模的服务器集群,用户可以通过
    发表于 08-16 17:02

    美国轻量服务器是什么?和服务器有哪些区别

    服务器以其低成本、轻运维的特点,特别适用于中小型应用、开发/测试环境、个人项目或博客等相对轻量级的工作负载。在美国,多家服务提供商提供
    的头像 发表于 08-16 11:20 334次阅读

    T-Mobile计划收购光纤互联网服务提供商Metronet

    近日,美国第二大无线运营T-Mobile US宣布了一项重大战略投资,将联合私募股权巨头KKR & Co.,共同出资49亿美元成立合资企业,旨在收购领先的光纤互联网服务提供商
    的头像 发表于 07-26 17:03 626次阅读

    亚马逊科技成为店匠科技的首选服务供应

    在当今日新月异的数字化时代,跨境电领域的竞争愈发激烈。深圳店匠科技有限公司,作为业内知名的跨境电解决方案提供商,始终致力于为客户带来前沿的技术体验与高效的业务支持。为了不断推动自身的技术创新和业务突破,店匠科技经过深思熟虑,
    的头像 发表于 06-12 14:14 355次阅读

    印孚瑟斯收购工程研发服务提供商in-tech

    全球知名IT服务提供商印孚瑟斯(Infosys)近日宣布,已与德国汽车行业领先的工程研发服务提供商in-tech达成最终收购协议。in-tech总部位于德国,以卓越的技术实力和发展速度
    的头像 发表于 05-06 10:39 485次阅读

    物联:什么是电梯黑匣子?具有哪些功能特点?

    电梯黑匣子,正式名称为电梯运行数据记录器,是一种利用当今最先进的物联网技术建设的系统,用于电梯系统中的数据记录。它通过安装物联网实时监测设备,可以实时采集电梯运行的各类参数,对电梯进行全天候的数据监控,并对数据进行长时间的存储。这些参数包括但不限于电梯的速度、位置、开关门状态、载重量等。
    的头像 发表于 04-14 17:53 716次阅读
    梯<b class='flag-5'>云</b>物联:什么是电梯<b class='flag-5'>黑匣子</b>?具有哪些功能特点?

    华砺智行荣获“2023车路协同优秀服务提供商”奖项

    3月19日,在第十三届(2024)智能交通市场年会上,华砺智行凭借多年的技术优势与成功实践经验荣获“2023车路协同优秀服务提供商”奖项,是全国8家荣获该项荣誉的企业之一。
    的头像 发表于 03-21 10:18 445次阅读
    华砺智行荣获“2023车路协同优秀<b class='flag-5'>服务</b><b class='flag-5'>提供商</b>”奖项

    基础软件中间件产品与服务提供商中创股份成功上市

    领域深耕二十余年,以技术创新和产品化、产业化为导向,树立起了值得信赖的品牌声誉,成为了我国领先的基础软件中间件产品与服务提供商
    的头像 发表于 03-13 14:21 628次阅读

    深入剖析飞机黑匣子内部PCB与芯片的秘密

    上为FDR,下为CVR Flight Data Recorder(FDR),中文一般叫飞行数据记录器,主要是记录飞机飞行过程中各项指标参数数据的设备。一般说黑匣子大部分都是指的FDR,是空难调查中最重要的直接证据。
    发表于 02-28 14:55 591次阅读
    深入剖析飞机<b class='flag-5'>黑匣子</b>内部PCB与<b class='flag-5'>芯片</b>的秘密

    全耀成为英飞凌独立设计提供商

    荣获英飞凌独立设计提供商证书,这标志着双方将进一步加强合作,基于全耀的毫米波雷达产品与英飞凌的半导体产品进行组合共同开发、设计满足市场和客户需求的系统解决方案。授牌
    的头像 发表于 12-30 08:11 409次阅读
    全耀<b class='flag-5'>成为</b>英飞凌独立设计<b class='flag-5'>提供商</b>

    AWS成为第一个提供NVIDIA GH200 Grace Hopper超级芯片提供商

    2023年的AWS re:Invent大会上,AWS和NVIDIA宣布AWS将成为第一个提供NVIDIA GH200 Grace Hopper超级芯片
    的头像 发表于 11-30 09:24 605次阅读
    AWS<b class='flag-5'>成为</b>第一个<b class='flag-5'>提供</b>NVIDIA GH200 Grace Hopper超级<b class='flag-5'>芯片</b>的<b class='flag-5'>提供商</b>

    离线语音识别及控制是怎样的技术?

    、带宽以及延迟等因素的影响,可以在各种情况下都提供稳定可靠的识别服务。  4. 节省成本:离线语音识别不需要使用服务,可以避免
    发表于 11-24 17:41

    服务商一般提供的存储服务有哪些

    服务商一般提供的存储服务有很多,包括以下几种: 对象存储服务:对象存储服务
    的头像 发表于 11-17 09:51 2462次阅读