在北京国家会议中心举行的“语音点亮生活——科大讯飞智能家庭语音产品发布会”圆满结束,现场展示了以智能语音为核心交互方式的智能硬件产品(智能电视、智能音响和车载),还发布了功能更全的灵犀3.0,同时以打造全自然交互平台为目标的语音云3.0也亮剑发布会。
语音云3.0给开发者们带来了更多更炫的能力,开启全自然交互必备利器。下面小云带您一起走进发布会现场去揭开语音云3.0的神秘面纱。
一.基础能力持续升级:稳固人机交互
自2010年推出全球首个智能语音交互的语音云平台开始,四年来科大讯飞不断突破智能语音技术极限,开放平台接口,语音云提供的能力更加丰富和个性。语音云3.0在语音识别、语音合成、语音唤醒等能力上持续优化升级,带来了诸多改进和提升。
1.持续领跑的语音识别
面对语音信息量大、方言种类多、环境噪声大、同音多义词众多等技术难题,科大讯飞持续优化:
1)抗噪:通过”前端+本地+云端“的降噪方式,形成了讯飞独特的”净音“方案;
2)方言:首推方言识别引擎,并率先用于讯飞输入法中,目前已支持粤语、东北话、天津话、四川话等十种方言,更多方言还在陆续开放中;
3)发音人:采用发音人自适应技术,实现个性化识别;
4)响应速度:运算优化,响应时间140ms,业内全面领先等等;
科大讯飞最先将DNN(深度神经网络)技术应用于语音识别中,120KM/H车速环境下,识别率依旧超过85%,是全球唯一一家在如此高速环境下保持高识别率的语音技术供应商,同时在奔驰和通用全球语音评测中荣获第一名。
2. 随叫随到的语音唤醒
低功耗、小尺寸、高唤醒率、低误唤醒率以及多唤醒词定制等优势让您随心所定。在小米2S上运行一天耗电量不超过0.4%,在嘈杂环境下,唤醒率超过97%,24小时误唤醒不超过1次,业界绝对领先。
3. 惟妙惟肖的语音合成
支持多语种多音色,同时提供特色音库、个性化音库和音色转换接口,让您随心所选,定制您的个性化合成,想用林志玲的声音为您服务,有何难?
二.创新能力加速布局:开启全自然交互
除了基础能力持续升级外,语音云3.0还在人脸识别、声纹识别、自然语音理解、手势识别、大数据分析、变现等方面加速布局,构建全自然交互平台,打造语音生态体系。
1. 明察秋毫的人脸识别
人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。讯飞语音云联合香港中文大学开放世界领先的人脸识别技术,准确度超过99%,超越Facebook、FBI.
2. 得手应心的手势识别
基于视觉的手势识别,让人机交互更加随心自然。
3. 能理解会思考的超脑计划
讯飞超脑计划组长江辉教授说:基于类人神经网络的认知智能引擎的讯飞超脑计划研究,预期成果是实现世界上第一个中文认知智能计算引擎!
4. 倾听用户的语音大数据分析
透过对语音大数据的分析,可以形成用户精确画像,实现效果评测,进行产品优化改进。
5.增值变现服务助力开发者获得稳健收益
语音云团队不断探索,整合移动优质增值资源开放了个性化彩铃服务,聚合业内领先移动广告服务商开放了广告业务,集成携程、高德等优质信源提供LBS变现服务,为开发者提供各种资源保障,让其专注于产品的同时,获得稳健收益,同时各种变现能力还在不断开拓与开放中。
三.加速梦想:亿元开发者扶持计划
移动互联网是实现梦想的绝佳时代,实现梦想不仅需要技术支撑,更需要资源和资金支持,为了帮助广大语音开发者快速实现梦想,讯飞开启了亿元开发者扶持计划,只要您有好的想法,好的创新产品,讯飞开发者扶持计划都将是您实现梦想的强力助推器!
四.开发者大赛:鼓励开拓创新
语音云开发者大赛作为语音产业的重要赛事,对鼓励开拓创新有重要的产业价值。当前,加盟语音云的合作伙伴超过40000家,其中高德、GlassX和争渡凭借产品创新、行业价值和智能语音交互带来的实用性,从诸多参赛作品中脱颖而出,最终进入大赛前三甲。
语音云3.0,全自然交互开放平台,助力各类应用实现创新腾飞的必备利器,开启的不仅是智能语音交互,更是集手势识别、人脸识别等能力于一体的全自然交互。
-
互联网
+关注
关注
54文章
11070浏览量
102592 -
智能语音
+关注
关注
10文章
773浏览量
48679
发布评论请先 登录
相关推荐
评论