10月30日消息,刚刚结束的李佳琦直播间里,剁手党通过阿里语音机器人首次实现与主播的实时互动。直播过程中,数十万用户同时用语音回答李佳琦的提问,最终机器人在50毫秒内就完成了语音识别和语音反馈全过程,反应速度是传统语音的20倍。
淘宝直播间观众用语音与李佳琦互动
今年双11期间,淘宝直播间推出 “语音猜价格”功能,观众在直播间也能实现语音交互,例如动动嘴就可以响应主播发出的猜产品价格任务。语音机器人成为决定这一互动过程能否顺畅的关键。
据介绍,一场淘宝直播的观众数量可达百万甚至千万,并且用户分布在全国各地,口音差异较大,目前主流的语音技术方案很难做到短时间内快速响应如此体量的用户语音,例如类似Siri识别用户语音的响应时长就在1秒以上,无法满足直播场景强互动的要求。
此次淘宝直播间采用了达摩院最新的移动端离线端到端语音识别技术。基于全新的网络结构和语音识别框架,即便在低配手机上,也能在50毫秒内完成语音交互过程,速度是传统语音识别的20倍;此外,该技术还解决了快语速、重口音等问题,高难度场景中的语音识别错误率降低近三成。
达摩院语音实验室技术专家万玉龙表示,“在实时性要求极高的场景,传统的云端语音方案无法满足需求,这套语音技术的创新在于同时实现了识别速度和准确度的提升,语音AI模型部署在每个用户的淘宝直播APP上,即便直播间有千万级别的用户,AI也不会漏听慢判。”
过去几年,阿里语音AI在基础研究和应用上取得了一系列突破。2019年,阿里语音AI入选《麻省理工评论》“全球十大突破性技术”,是唯一上榜的中国科技公司;今年7月IDC发布的《中国AI云服务市场半年度研究报告》显示,阿里语音AI以44%的市场份额,在云上语音AI市场中位居第一。
责任编辑:PSY
-
机器人
+关注
关注
209文章
27438浏览量
202485 -
语音识别
+关注
关注
38文章
1674浏览量
112000 -
Siri
+关注
关注
4文章
199浏览量
36900 -
阿里
+关注
关注
6文章
430浏览量
32719
发布评论请先 登录
相关推荐
Al大模型机器人
Abb工业机器人的主电源开关在什么位置
基于FPGA EtherCAT的六自由度机器人视觉伺服控制设计
GLaDOS交互机器人入选Hackster.io挑战赛9个优胜作品之一
stm32f303的比较器反应速度多少啊?
其利天下技术·搭载无刷电机的扫地机器人的前景如何?
逐际动力首次公开人形机器人的动态测试
用全志R128复刻自平衡赛车机器人,还实现了三种不同的操控方式
ROS让机器人开发更便捷,基于RK3568J+Debian系统发布!
机器人阻抗控制实现规律
ai人工智能机器人
基于Matlab和VR技术的移动机器人建模及仿真
![](https://file1.elecfans.com/web2/M00/91/70/wKgaomTgZ62ARbwmAAclu5Nwpxo482.png)
![](https://file1.elecfans.com/web2/M00/91/6C/wKgZomTgZ4yAT7ouAAT0kxcP3CU173.png)
评论