语音转写,也叫音频文件转写,是指批量将音频文件(5小时以内)转换成文本数据,适用于语音质检、会议访谈等场景。
语音转写与语音听写的区别主要体现在「支持的音频时长上」,语音转写支持的音频时长是在五小时以内,语音听写支持的音频时长是在一分钟以内。因此,两者的使用场景也略有不同,语音转写更多应用于贴近日常的对话、演讲等长文本场景,而语音听写则主要应用于人机对话、输入法、语音搜素等短文本场景。
目前,国内提供语音转写技术的厂商主要有:
1、科大讯飞
成立于1999年,2008年,公司在深圳证券交易所挂牌上市(股票代码:002230)。一直深耕在人工智能领域,技术很全也很综合,多次在语音识别、语音合成、机器翻译、图文识别、图像理解、阅读理解、机器推理等各项国际评测中取得佳绩。
在语音转写上,通用语音识别率98%(注:安徽电子产品监督检验所检测,报告编号151209010027),支持中文、英文、中英混合识别。支持12种方言,8种外语,2中民族语言,可提供公有云接口及私有化部署方案。
2、腾讯云
在语音转写上,字准率97%,与微信、王者荣耀的语音转文字使用一套服务。支持中文普通话、英语。支持2种方言,4种外语,后续将陆续开放其他语种和方言的识别能力。
3、百度智能云
百度智能云致力于为企业和开发者提供全球领先的人工智能、大数据和云计算服务。
在语音转写上,近场中文普通话识别准确率达98%。支持普通话和略带口音的中文识别,支持英文识别。
4、云知声
2012年6月创立于北京,是国内头部人工智能独角兽企业。
在语音转写上,准确率可达实用标准,适用于会议转写、字幕生成、音频内容分析等场景。
5、思必驰
07年创立于英国剑桥,08年回国落户苏州,12年完成A轮融资,是国内专业的对话式人工智能平台公司,拥有全链路的智能语音语言技术。
在长语音识别转写上,覆盖中文、英文、葡萄牙语等语种,粤、川、沪等方言,以及带方言的普通话。云端连续实时语音识别率>97%。
审核编辑:符乾江
-
语音识别
+关注
关注
38文章
1721浏览量
112547 -
人工智能
+关注
关注
1791文章
46859浏览量
237571
发布评论请先 登录
相关推荐
评论