0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

物联网时代,语音交互将会是智能硬件产品的入口

JsPm_robot_1hjq 来源:YXQ 2019-06-25 15:21 次阅读

特别是智能音箱,最近两年来发展迅猛,几乎所有主流企业都是入局者,如华为音箱、小米音箱、腾讯音箱等等,因大企业的入局,让国内智能音箱领域竞争更加残酷。

或许北京声智科技有限公司(以下简称:声智)会是一匹黑马,因为市面上大多数智能音箱,如小米、华为、腾讯等出品的智能音箱几乎都是采用声智的远程语音交互方案。

声智战略合伙人/副总裁李智勇说:“声智的强项在于远场语音交互能力,这也是华为、小米等与我们合作的原因,凡是和远场语音交互相关的部分,我们都是做的比较好的。”

对国内机器人企业而言,声智专业的远场语音交互技术或许可以提升机器人语音交互能力,特别是在复杂的商业场景里,语音交互可以得到更好的优化。

1号机器人网记者:声智有丰富的应用案例基础,你们的核心技术是体现在哪些方面?

李智勇:为了实现智能音箱的一次交互,核心技术有5点:

第一点是远场语音唤醒;第二点是麦克风阵列;第三点是远场语音识别;第四点是我们经常讲的自然语言处理;第五点是语音合成和TTS。这五个流程是每次交互都会用到,另外就是辅助的一些技术点。

比如经常说的声纹识别,你要区分每个讲话的人是谁?通话时通话的质量高不高?等等还要根据不同使用场景来进行优化不同的技术和算法

凡是和远场语音交互相关的部分,我们都是做的比较好的,现在市面上的主流智能音箱产品都是用我们的方案,如华为音箱、小米音箱、腾讯音箱等等。

另外,我们把各种复杂的技术整合在一套系统里,自主研发了远场智能交互系统SoundAI Azero,这样对产品方而言,就更加省事。产品方只需要注重产品其它部分的开发,如灯、按键等,然后搭载我们的SoundAI Azero系统就可以出产品了。对产品企业而言,与我们合作,可以大大节省产品开发的周期。

1号机器人网记者:要想得到完美的语音识别产品,需要经过多长的时间训练?一般语音识别的训练过程是怎样?

李智勇:语音识别训练与通常进行深度学习训练是一样的,首先有相应的数据进行标注,然后调一些参数进行训练,接下来看效果再进一步调优。

核心驱动点有两个,一个不是训练本身的时间,关键是数据,到底有多少数据?标注精不精准?另一个是训练本身,越往后发展,语音识别不能说只做一套识别就能适用所有。真正能做到的是,在特定领域,数据影响权重,变得比模型权重更大一些。

1号机器人网记者:可否介绍一下你们的麦克风阵列芯片?你们花了多久的时间进行研发?这片芯片都集成了哪些技术?

李智勇:这不是大家经常说的芯片,我们研发这款芯片是AI声学芯片,主要目的是让市面上已有的产品可接入麦克风阵列。

如市面上已有的电视机,很多不支持麦克风阵列,现在有了这片芯片后,可以很容易支持麦克风阵列。

随着物联网时代的到来,市面上很多IOT设备都会需要智能交互产品,而我们的芯片就是支撑已有产品很容易接入我们的远场语音交互系统SoundAI Azero。

1号机器人网记者:看官网介绍,你们的案例客户有百度、腾讯、阿里、小米、华为等等,你们为他们提供的是怎样的解决方案?它们的产品相互之间会存在差异吗?

李智勇:这些主流的产品,很多都是远场语音交互的设备,而我们的技术核心就体现在远场语音交互上,如远场语音唤醒、远场语音识别等。

不同客户,它的产品侧重点和特色不同,比如说华为音箱,它把通话的功能也加进来了,这是原来智能音箱所不具备的。还如腾讯王者荣耀机器人,从ID到整个产品的思路和通常的智能音箱也不同,所以它们产品相互之间还是存在差异的。

1号机器人网记者:现在市面上的儿童机器人种类繁多,针对儿童机器人,你们可以提供怎样的解决方案?

李智勇:儿童机器人也是分两部分:一部分是产品本身,如唤醒、降噪、麦克风阵列等,语音交互能力跟智能音箱是相通的。我们在智能音箱领域的经验可以移植到儿童机器人领域;另一部分是相比智能音箱,儿童机器人搭载的内容是不一样的。

我们在儿童机器人领域也有内容服务资源,我们与第三方企业合作,把内容服务接入到我们Sound Azero系统中来,现在在儿童机器人领域,我们可以提供一套比较完整的方案。

假设儿童机器人厂商,用我们的远场智能交互系统SoundAI Azero,他只需要选择一个唤醒词,再做一些基础的集成工作就可以了。比如针对具体的场景做一些技能的调整,再把你自己特别想输出的内容,接到系统里就可以了。我们可以提供部分儿童内容,但是更多技能端的扩展内容,儿童机器人企业也可以自己去寻找。

1号机器人网记者:目前已有不少大型商用机器人已经落地到政务系统,如深圳出入境就有一台机器人在服务,但是从现场体验来看,语音交互不是很理想,在商业噪杂的环境下,你们可以提供怎样的解决方案?

李智勇:目前语音交互有两个一大一小的瓶颈,大的瓶颈也是NLP当前的技术瓶颈,目前语音识别没办法达到100%的准确率;另外一个小的瓶颈就是在复杂环境下的远场降噪处理。

因为每家公司擅长的地方不一样,而远场语音交互是我们擅长的,虽然,我们还没有与商业机器人合作过,但是从我们的角度去看,语音交互是可以优化的。

因为在商场里,我们能解决智能音箱交互问题,如果是商业机器人,就需要机器人企业与我们联动配合优化,当然,经过一定周期的优化过程,我们可以提升商业机器人在复杂环境中的语音交互能力,甚至提升一个量级。

1号机器人网记者:就语音技术来讲,目前中国与西方国家是否存在技术差距?如果相互对比,西方技术的优势体现在哪里?国内的企业技术优势又体现在哪里?

李智勇:从技术上讲,目前中西方语音交互整体技术并没有太大的差距,大家基本处于同一个水平线。当然,类似亚马逊等公司在语音识别领域精耕很长时间,所以体验感会略好一些。

产品体验感并不是技术好了,体验就好了,它涉及很多的因素,如产品结构设计、响应速度、内容多少等等,这个是需要时间打磨的,国内很多语音企业都是2017年才出产品,发展也就两年时间。

其实中西方语音企业是可以互补的,比如中文领域,国内语音企业普遍做的比西方企业好,因为中国有大量语料、大量的数据,这是西方所不能比拟的。但是西方企业在英文领域精耕的很好,这是目前国内语音企业薄弱的地方。

1号机器人网记者:最后一个问题,从市场拓展的角度去讲,目前你们的业务重心是放在哪几个领域?你们是如何看待机器人这个市场?

李智勇:目前AIoT场景是很热门,而且跑的也很快,各种品类都在崛起,如:电视、机顶盒、儿童机器人和故事机、汽车车联网前装后装、白色家电等等,对我们来说,当前首先是智能音箱,属于成长最快的领域。

另外,从智能音箱延伸到其它产品,对我们来讲,场景迁移的成本并没有想象中的大,如延伸汽车领域、电视领域等等,我们目标是覆盖主流的通用产品领域,然后通过不同的技能来实现不同场景下不同的产品应用去解决客户的疑难杂症。

对于机器人,从技术视角和商业视角去讲:技术视角,机器人是众多技术的融合结晶,人工智能技术越成熟,机器人最终落地也会更完美;从商业视角来讲,现阶段机器人需要往更多垂直领域去精耕,因为通用机器人属于未来的产品,目前暂不适合。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2909

    文章

    44608

    浏览量

    373082
  • 语音交互
    +关注

    关注

    3

    文章

    286

    浏览量

    28009

原文标题:声智:物联网时代 语音交互将成IOT设备入口

文章出处:【微信号:robot-1hjqr,微信公众号:1号机器人网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于语音识别的智能会议系统具备哪些交互功能

    标贝科技专注智能语音交互领域多年,在语音识别和语音合成领域有着多项大型企业合作案例,标贝与多个智能
    的头像 发表于 12-20 10:35 66次阅读

    基于智能语音交互智能呼叫中心工作机制

    作为实现智能呼叫中心的关键技术之一的智能语音交互技术,它通过集成自然语言处理(NLP)、语音识别(ASR)和
    的头像 发表于 12-03 16:44 284次阅读
    基于<b class='flag-5'>智能</b><b class='flag-5'>语音</b><b class='flag-5'>交互</b>的<b class='flag-5'>智能</b>呼叫中心工作机制

    离线语音芯片让家电变得智能

    九芯电子推出三款离线语音芯片NRK330X、NRK3502、NRK3603,具备无需联网、响应快等优势,适用于智能家居等领域,提供精准语音识别体验,助力
    的头像 发表于 11-26 15:08 160次阅读
    离线<b class='flag-5'>语音</b>芯片让家电变得<b class='flag-5'>智能</b>

    联网学习路线来啦!

    ,开发物联网智能硬件产品大有裨益。 3.2.3图形界面开发 对于有显示界面的智能
    发表于 11-11 16:03

    【实操文档】在智能硬件的大模型语音交互流程中接入RAG知识库

    本帖最后由 jf_40317719 于 2024-9-29 17:13 编辑 智能硬件语音交互接入大模型后可以直接理解自然语言内容,但大模型作为一个语言模型,对专业领域知识
    发表于 09-29 17:12

    MQTT智能网关接入联网平台:实现高效连接与数据交互

    连接设备和联网平台的关键桥梁,在数据采集、传输和控制中发挥着至关重要的作用。本文将详细介绍MQTT智能网关如何接入联网平台,实现高效连接
    的头像 发表于 09-27 17:04 320次阅读

    联网系统智能控制产品语音识别方案_离线语音识别芯片分析

    01 联网系统中为什么要使用离线语音识别芯片 联网系统中使用离线语音识别芯片的原因主要基于以
    的头像 发表于 09-26 17:56 584次阅读
    <b class='flag-5'>物</b><b class='flag-5'>联网</b>系统<b class='flag-5'>智能</b>控制<b class='flag-5'>产品</b>的<b class='flag-5'>语音</b>识别方案_离线<b class='flag-5'>语音</b>识别芯片分析

    联网系统中音频方案的“大脑”_语音芯片

    交互方式。这种交互方式尤其适合在双手被占用或视线受限的情境下使用,极大地提升了用户体验。 2、拓展应用场景 多样化需求:随着联网技术的普及,越来越多的领域开始应用
    的头像 发表于 09-26 14:26 390次阅读
    <b class='flag-5'>物</b><b class='flag-5'>联网</b>系统中音频方案的“大脑”_<b class='flag-5'>语音</b>芯片

    什么是联网技术?

    什么是联网技术? 联网技术(Internet of Things, IoT)是一种通过信息传感设备,按约定的协议,将任何物体与网络相连接,实现
    发表于 08-19 14:08

    聆思CSK6视觉语音大模型AI开发板入门资源合集(硬件资料、大模型语音/多模态交互/英语评测SDK合集)

    丰富外设配件 配套多模态应用示例,支持快速上手体验大模型语音交互智能视觉等 AI 应用 板载 DAPLINK 调试器,外接一条USB 线即可实现烧录、调试、串口日志查看 板载网络模组,支持开发
    发表于 06-18 17:33

    生态流量监测系统解决方案硬件产品#联网

    联网硬件
    北京恒润安
    发布于 :2024年05月29日 11:55:08

    智能语音交互技术如何助力设备实现人机自然对话

    智能语音交互技术是指通过语音识别、语音合成和自然语言理解等技术,实现人与机器之间自然语言的交流和互动。随着现代人工
    的头像 发表于 05-23 15:14 377次阅读

    基于机智云联网平台的智能垃圾回收箱与控制系统研究

    一款基于机械传动、嵌入式系统和联网技术的智能垃圾回收箱及控制系统。结合功能需求设计了结构方案,包括尺寸、开关门、防夹手机和称重结构等;选型硬件包括主控制器、电源、称重检测、显示、电机
    发表于 04-09 17:25

    机智云联网:连接智能AirKiss配网技术

    联网时代智能硬件的快速发展为我们的生活带来了便利和舒适。然而,对于用户而言,智能设备的连
    的头像 发表于 03-26 16:36 635次阅读

    蓝牙联网智能硬件-蓝牙网关

    作为蓝牙联网智能硬件的核心组件,也得到了广泛的应用和关注。蓝牙网关是一种能够将蓝牙信号与互联网进行连接的设备,它能够实现各种
    的头像 发表于 02-25 19:54 529次阅读
    蓝牙<b class='flag-5'>物</b><b class='flag-5'>联网</b><b class='flag-5'>智能</b><b class='flag-5'>硬件</b>-蓝牙网关