语音听写,是指将短音频(≤60秒)精准识别成文字,实时返回结果,达到边说边返回的效果。
除了要考虑本身语音听写模型或算法的识别准确率之外,一些智能硬件的产品还需要额外考虑降噪、回声消除、去混响等因素,这些都是保证最后识别效果的重要因素。因为涉及软硬件,对能力交付方的项目经验提出了较高的要求。
目前,国内提供语音听写技术的厂商主要有:
1、科大讯飞
成立于1999年,2008年,公司在深圳证券交易所挂牌上市(股票代码:002230)。一直深耕在人工智能领域,技术很全也很综合,多次在语音识别、语音合成、机器翻译、图文识别、图像理解、阅读理解、机器推理等各项国际评测中取得佳绩。
在语音听写上,除中文普通话和英文外,支持51个语种、24种方言和1个民族语言,可提供公有云接口及私有化部署方案。采用行业先进的语音识别技术,识别率可达98% 。目前广泛应用于语音搜索、聊天输入、游戏娱乐、人机交互等场景。
2、百度
该技术主要由百度智能云提供,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。近场中文普通话识别准确率达98%,在语言支持上覆盖主流的普通话、口音普通话、粤语、四川话、英语。
3、云知声
2012年6月创立于北京,是国内头部人工智能独角兽企业。语音听写主要应用于语音搜索、语音输入、语音控制等场景。准确率可达实用标准,支持普通话、四川话、粤语、英语的识别。
4、思必驰
07年创立于英国剑桥,08年回国落户苏州,12年完成A轮融资,是国内专业的对话式人工智能平台公司,拥有全链路的智能语音语言技术。语音识别提供基于云+端混合引擎的连续语音识别,覆盖中文、英文、葡萄牙语等语种,粤、川、沪等方言,以及带方言的普通话。云端连续实时语音识别率>97%,可提供公有云接口及私有化部署方案。
审核编辑:符乾江
-
语音识别
+关注
关注
38文章
1708浏览量
112465 -
人工智能
+关注
关注
1789文章
46545浏览量
236830
发布评论请先 登录
相关推荐
评论