0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里语音机器人首次实现与主播的实时互动 反应速度是Siri的20倍

工程师邓生 来源:猎云网 作者:猎云网 2020-11-02 17:47 次阅读

10月30日消息,刚刚结束的李佳琦直播间里,剁手党通过阿里语音机器人首次实现与主播的实时互动。直播过程中,数十万用户同时用语音回答李佳琦的提问,最终机器人在50毫秒内就完成了语音识别和语音反馈全过程,反应速度是传统语音的20倍。

淘宝直播间观众用语音与李佳琦互动

今年双11期间,淘宝直播间推出 “语音猜价格”功能,观众在直播间也能实现语音交互,例如动动嘴就可以响应主播发出的猜产品价格任务。语音机器人成为决定这一互动过程能否顺畅的关键。

据介绍,一场淘宝直播的观众数量可达百万甚至千万,并且用户分布在全国各地,口音差异较大,目前主流的语音技术方案很难做到短时间内快速响应如此体量的用户语音,例如类似Siri识别用户语音的响应时长就在1秒以上,无法满足直播场景强互动的要求。

此次淘宝直播间采用了达摩院最新的移动端离线端到端语音识别技术。基于全新的网络结构和语音识别框架,即便在低配手机上,也能在50毫秒内完成语音交互过程,速度是传统语音识别的20倍;此外,该技术还解决了快语速、重口音等问题,高难度场景中的语音识别错误率降低近三成。

达摩院语音实验室技术专家万玉龙表示,“在实时性要求极高的场景,传统的云端语音方案无法满足需求,这套语音技术的创新在于同时实现了识别速度和准确度的提升,语音AI模型部署在每个用户的淘宝直播APP上,即便直播间有千万级别的用户,AI也不会漏听慢判。”

过去几年,阿里语音AI在基础研究和应用上取得了一系列突破。2019年,阿里语音AI入选《麻省理工评论》“全球十大突破性技术”,是唯一上榜的中国科技公司;今年7月IDC发布的《中国AI云服务市场半年度研究报告》显示,阿里语音AI以44%的市场份额,在云上语音AI市场中位居第一。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28745

    浏览量

    208919
  • 语音识别
    +关注

    关注

    38

    文章

    1745

    浏览量

    113015
  • Siri
    +关注

    关注

    4

    文章

    206

    浏览量

    37138
  • 阿里
    +关注

    关注

    6

    文章

    447

    浏览量

    32919
收藏 人收藏

    评论

    相关推荐

    【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

    ,一次生成深度信息。 自主机器人定位任务的本质是对机器人自身状态的估计问题,包括位置,朝向,速度等问题。 路径规划旨在找到从起点到目标区域的路径,确保路径的可行性和最优性。路径规划方法包括变分方法,图搜
    发表于 01-04 19:22

    开源项目!能够精确地行走、跳舞和执行复杂动作的机器人—Tillu

    认识Tillu——机器人 Tillu是一款融合先进机器人技术与创造力的独特机器人,旨在激发学习与创新!它由运行Debian操作系统的UNIHIKER驱动,利用强大的控制系统实现逼真的动
    发表于 01-02 17:24

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    中取得了令人瞩目的效果。 阅读感悟 从传统的手动编程到借助大模型实现智能化、自主化,从单一模态的交互到多模态信息的深度融合,再到扩散模型的应用,机器人控制技术正在以惊人的速度进化。这不仅让机器
    发表于 12-29 23:04

    【「具身智能机器人系统」阅读体验】1.初步理解具身智能

    现状和前沿研究,详细介绍大模型的构建方法、训练数据、模型架构和优化技术。 第4部分(第10章到第13章)深入探讨提升机器人计算实时性、算法安全性、系统可靠性及具身智能数据挑战的具身智能机器人系统研究
    发表于 12-28 21:12

    【「具身智能机器人系统」阅读体验】+初品的体验

    解决许多技术的和非技术的挑战,如提高智能体的自主性、处理复杂环境互动的能力及确保行为的伦理和安全性。 未来的研究需要将视觉、语音和其他传感技术与机器人技术相结合,以探索更加先进的知识表示和记忆模块,利用强化学习进一步优化决策过程
    发表于 12-20 19:17

    《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

    ,互联网行业占成熟经济体的GDP增长的21%,世界经济正面向数字经济转型的大趋势。具身智能机器人集成人工智能、高端制造、新材料等技术,其核心在于通过智能体与环境的动态互动实现智能行为。 在第2章“具身
    发表于 12-19 22:26

    汤姆猫发布AI语音情感陪伴机器人研发进展

    ,能够智能识别声音来源的位置与方向,实现120°的自由转头,确保始终面向用户进行语音对话。这一设计不仅增强了机器人互动性,还大大提升了用户的沟通体验。 此外,汤姆猫AI
    的头像 发表于 12-17 11:27 827次阅读

    机器人语音功能

    经典卡通角色的声音成为了它们的“名片”。那么,机器人语音功能究竟是如何实现的?它与智能模组有什么关系?谁是这类服务机器人语音“指挥官”?
    的头像 发表于 12-02 10:50 567次阅读

    语音识别机器人的工作原理

    语音识别机器人的工作原理主要基于一系列复杂的技术流程,包括信号采集、预处理、特征提取、声学模型匹配、语言模型预测以及最终的解码输出。 一、信号采集 语音识别机器人首先通过麦克风等音频输
    的头像 发表于 10-25 09:25 595次阅读

    构建语音控制机器人 - 线性模型和机器学习

    2024-07-31 |Annabel Ng 在该项目的[上一篇博客文章]中,我介绍了运行机器人电机、处理音频信号和调节电压所需的电路的基础知识。然而,机器人还没有完全完成!尽管机器人可以正确移动
    的头像 发表于 10-02 16:31 286次阅读
    构建<b class='flag-5'>语音</b>控制<b class='flag-5'>机器人</b> - 线性模型和<b class='flag-5'>机器</b>学习

    开源项目!用ESP32做一个可爱的无用机器人

    简介 作者在完成硕士论文答辩后,利用空闲时间制作了一个他一直想做的机器人——可爱无用机器人。 无用机器人原理是一个连接到开关的电机,通过逻辑门控制。当开关被推到“开”时,机器人启动
    发表于 09-03 09:34

    Al大模型机器人

    金航标kinghelm萨科微slkor总经理宋仕强介绍说,萨科微Al大模型机器人有哪些的优势?萨科微AI大模型机器人由清华大学毕业的天才少年N博士和王博士团队开发,与同行相比具有许多优势:语言
    发表于 07-05 08:52

    基于FPGA EtherCAT的六自由度机器人视觉伺服控制设计

    和增强系统处理图像的实时性,本文提出了一种伊瑟特的六自由度机器人视觉伺服控制系统,将摄像头集成到基于 Zynq的伊瑟特站上,提高了视觉伺服的实时性.经测试,该平台能够对视觉检测目标的
    发表于 05-29 16:17

    stm32f303的比较器反应速度多少啊?

    stm32f303的比较器反应速度多少啊?有木有20mv的数据?手册上说:100mv的压差反应延时为35ns。怎么我的应用里用PA0输出光上升沿就用了5ms之多呢?(为了验证一下,我直接断点,捕获的波形)比较器配置为为高速模式,
    发表于 05-08 06:08

    其利天下技术·搭载无刷电机的扫地机器人的前景如何?

    地毯并增加吸力,或是绕过障碍物进行清扫。同时,通过手机APP远程控制、语音指令等方式,用户可以方便地操作扫地机器人实现个性化的清洁需求。 3.扫地机器人面临的技术壁垒与客户体验问题
    发表于 05-05 15:03