0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于语音云3.0开启全自然交互的分析和应用

讯飞开放平台 来源:djl 2019-10-08 15:38 次阅读

在北京国家会议中心举行的“语音点亮生活——科大讯飞智能家庭语音产品发布会”圆满结束,现场展示了以智能语音为核心交互方式的智能硬件产品(智能电视、智能音响和车载),还发布了功能更全的灵犀3.0,同时以打造全自然交互平台为目标的语音云3.0也亮剑发布会。
语音云3.0给开发者们带来了更多更炫的能力,开启全自然交互必备利器。下面小云带您一起走进发布会现场去揭开语音云3.0的神秘面纱。

一.基础能力持续升级:稳固人机交互

自2010年推出全球首个智能语音交互的语音云平台开始,四年来科大讯飞不断突破智能语音技术极限,开放平台接口,语音云提供的能力更加丰富和个性。语音云3.0在语音识别、语音合成、语音唤醒等能力上持续优化升级,带来了诸多改进和提升。


1.持续领跑的语音识别
面对语音信息量大、方言种类多、环境噪声大、同音多义词众多等技术难题,科大讯飞持续优化:
1)抗噪:通过”前端+本地+云端“的降噪方式,形成了讯飞独特的”净音“方案;
2)方言:首推方言识别引擎,并率先用于讯飞输入法中,目前已支持粤语、东北话、天津话、四川话等十种方言,更多方言还在陆续开放中;
3)发音人:采用发音人自适应技术,实现个性化识别;
4)响应速度:运算优化,响应时间140ms,业内全面领先等等;
科大讯飞最先将DNN(深度神经网络)技术应用于语音识别中,120KM/H车速环境下,识别率依旧超过85%,是全球唯一一家在如此高速环境下保持高识别率的语音技术供应商,同时在奔驰和通用全球语音评测中荣获第一名。
2. 随叫随到的语音唤醒
低功耗、小尺寸、高唤醒率、低误唤醒率以及多唤醒词定制等优势让您随心所定。在小米2S上运行一天耗电量不超过0.4%,在嘈杂环境下,唤醒率超过97%,24小时误唤醒不超过1次,业界绝对领先。
3. 惟妙惟肖的语音合成
支持多语种多音色,同时提供特色音库、个性化音库和音色转换接口,让您随心所选,定制您的个性化合成,想用林志玲的声音为您服务,有何难?

二.创新能力加速布局:开启全自然交互

除了基础能力持续升级外,语音云3.0还在人脸识别、声纹识别、自然语音理解、手势识别、大数据分析、变现等方面加速布局,构建全自然交互平台,打造语音生态体系。
1. 明察秋毫的人脸识别
人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。讯飞语音云联合香港中文大学开放世界领先的人脸识别技术,准确度超过99%,超越Facebook、FBI.

2. 得手应心的手势识别
基于视觉的手势识别,让人机交互更加随心自然。
3. 能理解会思考的超脑计划
讯飞超脑计划组长江辉教授说:基于类人神经网络的认知智能引擎的讯飞超脑计划研究,预期成果是实现世界上第一个中文认知智能计算引擎!

4. 倾听用户的语音大数据分析
透过对语音大数据的分析,可以形成用户精确画像,实现效果评测,进行产品优化改进。
5.增值变现服务助力开发者获得稳健收益
语音云团队不断探索,整合移动优质增值资源开放了个性化彩铃服务,聚合业内领先移动广告服务商开放了广告业务,集成携程、高德等优质信源提供LBS变现服务,为开发者提供各种资源保障,让其专注于产品的同时,获得稳健收益,同时各种变现能力还在不断开拓与开放中。

三.加速梦想:亿元开发者扶持计划

移动互联网是实现梦想的绝佳时代,实现梦想不仅需要技术支撑,更需要资源和资金支持,为了帮助广大语音开发者快速实现梦想,讯飞开启了亿元开发者扶持计划,只要您有好的想法,好的创新产品,讯飞开发者扶持计划都将是您实现梦想的强力助推器!

四.开发者大赛:鼓励开拓创新

语音云开发者大赛作为语音产业的重要赛事,对鼓励开拓创新有重要的产业价值。当前,加盟语音云的合作伙伴超过40000家,其中高德、GlassX和争渡凭借产品创新、行业价值和智能语音交互带来的实用性,从诸多参赛作品中脱颖而出,最终进入大赛前三甲。

语音云3.0,全自然交互开放平台,助力各类应用实现创新腾飞的必备利器,开启的不仅是智能语音交互,更是集手势识别、人脸识别等能力于一体的全自然交互。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 互联网
    +关注

    关注

    54

    文章

    11105

    浏览量

    103000
  • 智能语音
    +关注

    关注

    10

    文章

    781

    浏览量

    48704
收藏 人收藏

    评论

    相关推荐

    ASR与自然语言处理的结合

    。以下是对ASR与自然语言处理结合的分析: 一、ASR与NLP的基本概念 ASR(自动语音识别) : 专注于将人类的语音转换为文字。 涉及从声音信号中提取特征,并将这些特征映射到文本。
    的头像 发表于 11-18 15:19 285次阅读

    【实操文档】在智能硬件的大模型语音交互流程中接入RAG知识库

    本帖最后由 jf_40317719 于 2024-9-29 17:13 编辑 智能硬件的语音交互接入大模型后可以直接理解自然语言内容,但大模型作为一个语言模型,对专业领域知识的训练缺乏也是
    发表于 09-29 17:12

    三星Bixby语音助手即将进军家电产品,实现自然语言交互

     三星宣布,Bixby语音助手即将全面进驻BESPOKE AI系列家电,用户可通过自然语言对家电进行语音控制。Bixby作为三星智能手机、手表、平板及电视的核心功能,如今将拓展至更多家电领域。
    的头像 发表于 08-26 17:20 704次阅读

    语音识别和自然语言处理的区别和联系

    语音识别和自然语言处理是人工智能领域的两个重要分支,它们在很多方面有着紧密的联系,同时也存在一些明显的区别。本文将详细介绍语音识别和自然语言处理的区别和联系。 一、
    的头像 发表于 07-05 10:09 1413次阅读

    智能语音交互技术如何助力设备实现人机自然对话

    随着现代人工智能在各行业的普及,智能语音交互技术也越来越多的在日常工作、生活中应用,智能语音交互的出现不仅仅大量节省了人工的工作时间提高了工作效率,为人们工作生活带来便利的同时,也改变
    的头像 发表于 05-23 15:16 681次阅读
    智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>技术如何助力设备实现人机<b class='flag-5'>自然</b>对话

    智能语音交互技术如何助力设备实现人机自然对话

    智能语音交互技术是指通过语音识别、语音合成和自然语言理解等技术,实现人与机器之间自然语言的交流和
    的头像 发表于 05-23 15:14 356次阅读

    WTK6900G语音识别芯片在车载语音交互氛围灯上的应用案例解析

    随着智能汽车的快速发展,车载语音交互技术逐渐成为提升驾驶体验的关键技术之一。传统的车载灯光控制系统往往依赖于手动操作,不仅操作繁琐,而且在驾驶过程中容易分散驾驶员的注意力。因此,开发一种高效、便捷
    的头像 发表于 05-17 13:57 365次阅读

    **十万级口语识别,离线自然说技术,让智能照明更懂你**

    自然说技术,用户不用死记硬背,提供了更自然、更灵活、更智能的语音交互方式。 方案框图 在方案设计上,启英泰伦充分考虑了产品功能、复杂程度和制造成本等因素。通过将
    发表于 04-29 17:09

    让设备更聪明 |离线自然说,开启智能语音交互新体验!

    ,导致用户只能使用固定的词条来控制设备,大大降低了用户与设备之间的语音交互体验。用户A通过传统离线语音交互来打开空调他只能说:“打开空调”近日,启英泰伦新推出「离
    的头像 发表于 01-10 08:15 932次阅读
    让设备更聪明 |离线<b class='flag-5'>自然</b>说,<b class='flag-5'>开启</b>智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>新体验!

    让设备更聪明 |启英泰伦离线自然说,开启智能语音交互新体验!

    启英泰伦新推出「离线自然说」——一种轻量级的离线NLP技术。通过该技术,语音芯片可支持数万条离线词条,泛化能力强,几乎可涵盖用户日常所有说话习惯,可以为用户提供更自然、更丰富、更灵活的离线语音
    的头像 发表于 01-04 11:24 726次阅读
    让设备更聪明 |启英泰伦离线<b class='flag-5'>自然</b>说,<b class='flag-5'>开启</b>智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>新体验!

    语音数据集:开启智能语音技术的新篇章

    随着人工智能技术的飞速发展,语音数据集在推动智能语音技术的进步中发挥着越来越重要的作用。语音数据集是训练和优化语音识别、语音合成等智能
    的头像 发表于 12-29 11:06 631次阅读

    语音数据集:AI语音技术的灵魂

    提升语音识别和生成能力:语音数据集为AI模型提供了丰富的语音样本,通过训练和学习这些数据,AI可以更好地理解和模拟人类的语音特征,从而提高语音
    的头像 发表于 12-14 14:33 977次阅读

    离线语音识别技术:掌控未来的语音交互

    离线语音识别技术的核心优势在于其独立性和实时性。在没有网络连接的情况下,设备依然能够迅速识别用户的语音指令,实现各种功能。这使得语音交互更加自然
    的头像 发表于 12-13 11:12 548次阅读
    离线<b class='flag-5'>语音</b>识别技术:掌控未来的<b class='flag-5'>语音</b><b class='flag-5'>交互</b>

    离线语音识别“自然说”:掌控未来的智能交互

    离线语音识别“自然说”以其独特优势,为用户带来了前所未有的便捷与舒适体验。它无需依赖网络环境,让用户在任何地点、任何时间都能享受到高效的语音识别服务。无论是在地铁、电梯还是偏远地区,只需简单说出需求,离线
    的头像 发表于 12-05 10:55 509次阅读
    离线<b class='flag-5'>语音</b>识别“<b class='flag-5'>自然</b>说”:掌控未来的智能<b class='flag-5'>交互</b>

    离线语音自然说”让风扇更智能

    离线语音自然说”技术是一种先进的语音识别技术,它能够在没有网络连接的情况下识别用户的语音指令,实现对智能风扇的控制。这意味着用户无需连接网络,即可随时随地通过
    的头像 发表于 11-27 10:48 675次阅读
    离线<b class='flag-5'>语音</b>“<b class='flag-5'>自然</b>说”让风扇更智能