关于语音云3.0开启全自然交互的分析和应用-电子发烧友网

在北京国家会议中心举行的“语音点亮生活——科大讯飞智能家庭语音产品发布会”圆满结束，现场展示了以智能语音为核心交互方式的智能硬件产品（智能电视、智能音响和车载），还发布了功能更全的灵犀3.0，同时以打造全自然交互平台为目标的语音云3.0也亮剑发布会。
语音云3.0给开发者们带来了更多更炫的能力，开启全自然交互必备利器。下面小云带您一起走进发布会现场去揭开语音云3.0的神秘面纱。

一.基础能力持续升级：稳固人机交互

自2010年推出全球首个智能语音交互的语音云平台开始，四年来科大讯飞不断突破智能语音技术极限，开放平台接口，语音云提供的能力更加丰富和个性。语音云3.0在语音识别、语音合成、语音唤醒等能力上持续优化升级，带来了诸多改进和提升。

1．持续领跑的语音识别
面对语音信息量大、方言种类多、环境噪声大、同音多义词众多等技术难题，科大讯飞持续优化：
1）抗噪：通过”前端+本地+云端“的降噪方式，形成了讯飞独特的”净音“方案；
2）方言：首推方言识别引擎，并率先用于讯飞输入法中，目前已支持粤语、东北话、天津话、四川话等十种方言，更多方言还在陆续开放中；
3）发音人：采用发音人自适应技术，实现个性化识别；
4）响应速度：运算优化，响应时间140ms，业内全面领先等等；
科大讯飞最先将DNN（深度神经网络）技术应用于语音识别中，120KM/H车速环境下，识别率依旧超过85%，是全球唯一一家在如此高速环境下保持高识别率的语音技术供应商，同时在奔驰和通用全球语音评测中荣获第一名。
2. 随叫随到的语音唤醒
低功耗、小尺寸、高唤醒率、低误唤醒率以及多唤醒词定制等优势让您随心所定。在小米2S上运行一天耗电量不超过0.4%，在嘈杂环境下，唤醒率超过97%，24小时误唤醒不超过1次，业界绝对领先。
3. 惟妙惟肖的语音合成
支持多语种多音色，同时提供特色音库、个性化音库和音色转换接口，让您随心所选，定制您的个性化合成，想用林志玲的声音为您服务，有何难？

二.创新能力加速布局：开启全自然交互

除了基础能力持续升级外，语音云3.0还在人脸识别、声纹识别、自然语音理解、手势识别、大数据分析、变现等方面加速布局，构建全自然交互平台，打造语音生态体系。
1. 明察秋毫的人脸识别
人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。讯飞语音云联合香港中文大学开放世界领先的人脸识别技术，准确度超过99%，超越Facebook、FBI.

2. 得手应心的手势识别
基于视觉的手势识别，让人机交互更加随心自然。
3. 能理解会思考的超脑计划
讯飞超脑计划组长江辉教授说：基于类人神经网络的认知智能引擎的讯飞超脑计划研究，预期成果是实现世界上第一个中文认知智能计算引擎！

4. 倾听用户的语音大数据分析
透过对语音大数据的分析，可以形成用户精确画像，实现效果评测，进行产品优化改进。
5.增值变现服务助力开发者获得稳健收益
语音云团队不断探索，整合移动优质增值资源开放了个性化彩铃服务，聚合业内领先移动广告服务商开放了广告业务，集成携程、高德等优质信源提供LBS变现服务，为开发者提供各种资源保障，让其专注于产品的同时，获得稳健收益，同时各种变现能力还在不断开拓与开放中。

三.加速梦想：亿元开发者扶持计划

移动互联网是实现梦想的绝佳时代，实现梦想不仅需要技术支撑，更需要资源和资金支持，为了帮助广大语音开发者快速实现梦想，讯飞开启了亿元开发者扶持计划，只要您有好的想法，好的创新产品，讯飞开发者扶持计划都将是您实现梦想的强力助推器！

四.开发者大赛：鼓励开拓创新

语音云开发者大赛作为语音产业的重要赛事，对鼓励开拓创新有重要的产业价值。当前，加盟语音云的合作伙伴超过40000家，其中高德、GlassX和争渡凭借产品创新、行业价值和智能语音交互带来的实用性，从诸多参赛作品中脱颖而出，最终进入大赛前三甲。

语音云3.0，全自然交互开放平台，助力各类应用实现创新腾飞的必备利器，开启的不仅是智能语音交互，更是集手势识别、人脸识别等能力于一体的全自然交互。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

互联网

互联网

+关注

关注
54

文章
11153

浏览量
103272
智能语音

智能语音

+关注

关注
10

文章
782

浏览量
48768

曙光云开启全栈智能时代

近日，“全栈可信云中生智”曙光云战略发布会召开。曙光云从首创“城市云”进化到实现“全栈智能云”

发表于 12-19 15:11 •221次阅读

基于智能语音交互的智能呼叫中心工作机制

作为实现智能呼叫中心的关键技术之一的智能语音交互技术，它通过集成自然语言处理（NLP）、语音识别（ASR）和语音合成（TTS）等先进技术，实

发表于 12-03 16:44 •284次阅读

基于智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>的智能呼叫中心工作机制

语音识别与自然语言处理的关系

了人机交互的革命，使得机器能够更加自然地与人类沟通。语音识别技术概述语音识别，也称为自动语音识别（ASR），是指将人类的

发表于 11-26 09:21 •366次阅读

ASR与自然语言处理的结合

。以下是对ASR与自然语言处理结合的分析：一、ASR与NLP的基本概念 ASR（自动语音识别）：专注于将人类的语音转换为文字。涉及从声音信号中提取特征，并将这些特征映射到文本。

发表于 11-18 15:19 •405次阅读

【实操文档】在智能硬件的大模型语音交互流程中接入RAG知识库

本帖最后由 jf_40317719 于 2024-9-29 17:13 编辑智能硬件的语音交互接入大模型后可以直接理解自然语言内容，但大模型作为一个语言模型，对专业领域知识的训练缺乏也是

发表于 09-29 17:12

三星Bixby语音助手即将进军家电产品,实现自然语言交互

　三星宣布，Bixby语音助手即将全面进驻BESPOKE AI系列家电，用户可通过自然语言对家电进行语音控制。Bixby作为三星智能手机、手表、平板及电视的核心功能，如今将拓展至更多家电领域。

发表于 08-26 17:20 •760次阅读

如何理解云计算？

，支持训练和部署复杂的人工智能和机器学习模型。用户可以使用云计算平台来开发和部署智能语音识别、图像识别、自然语言处理等应用。 **物联网：**云计算用于处理和存储来自物联网设备产生的大

发表于 08-16 17:02

语音识别和自然语言处理的区别和联系

语音识别和自然语言处理是人工智能领域的两个重要分支，它们在很多方面有着紧密的联系，同时也存在一些明显的区别。本文将详细介绍语音识别和自然语言处理的区别和联系。一、

发表于 07-05 10:09 •1742次阅读

智能语音交互技术如何助力设备实现人机自然对话

随着现代人工智能在各行业的普及，智能语音交互技术也越来越多的在日常工作、生活中应用，智能语音交互的出现不仅仅大量节省了人工的工作时间提高了工作效率，为人们工作生活带来便利的同时，也改变

发表于 05-23 15:16 •719次阅读

智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>技术如何助力设备实现人机<b class='flag-5'>自然</b>对话

智能语音交互技术如何助力设备实现人机自然对话

智能语音交互技术是指通过语音识别、语音合成和自然语言理解等技术，实现人与机器之间自然语言的交流和

发表于 05-23 15:14 •377次阅读

WTK6900G语音识别芯片在车载语音交互氛围灯上的应用案例解析

随着智能汽车的快速发展，车载语音交互技术逐渐成为提升驾驶体验的关键技术之一。传统的车载灯光控制系统往往依赖于手动操作，不仅操作繁琐，而且在驾驶过程中容易分散驾驶员的注意力。因此，开发一种高效、便捷

发表于 05-17 13:57 •412次阅读

十万级口语识别，离线自然说技术，让智能照明更懂你

自然说技术，用户不用死记硬背，提供了更自然、更灵活、更智能的语音交互方式。方案框图在方案设计上，启英泰伦充分考虑了产品功能、复杂程度和制造成本等因素。通过将

发表于 04-29 17:09

让设备更聪明 |离线自然说，开启智能语音交互新体验！

，导致用户只能使用固定的词条来控制设备，大大降低了用户与设备之间的语音交互体验。用户A通过传统离线语音交互来打开空调他只能说：“打开空调”近日，启英泰伦新推出「离

发表于 01-10 08:15 •1021次阅读

让设备更聪明 |离线<b class='flag-5'>自然</b>说，<b class='flag-5'>开启</b>智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>新体验！

让设备更聪明 |启英泰伦离线自然说，开启智能语音交互新体验！

启英泰伦新推出「离线自然说」——一种轻量级的离线NLP技术。通过该技术，语音芯片可支持数万条离线词条，泛化能力强，几乎可涵盖用户日常所有说话习惯，可以为用户提供更自然、更丰富、更灵活的离线语音

发表于 01-04 11:24 •803次阅读

语音数据集：开启智能语音技术的新篇章

随着人工智能技术的飞速发展，语音数据集在推动智能语音技术的进步中发挥着越来越重要的作用。语音数据集是训练和优化语音识别、语音合成等智能

发表于 12-29 11:06 •704次阅读

搜索历史

关于语音云3.0开启全自然交互的分析和应用

评论

曙光云开启全栈智能时代

基于智能语音交互的智能呼叫中心工作机制

语音识别与自然语言处理的关系

ASR与自然语言处理的结合

【实操文档】在智能硬件的大模型语音交互流程中接入RAG知识库

三星Bixby语音助手即将进军家电产品,实现自然语言交互

如何理解云计算？

语音识别和自然语言处理的区别和联系

智能语音交互技术如何助力设备实现人机自然对话

智能语音交互技术如何助力设备实现人机自然对话

WTK6900G语音识别芯片在车载语音交互氛围灯上的应用案例解析

十万级口语识别，离线自然说技术，让智能照明更懂你

让设备更聪明 |离线自然说，开启智能语音交互新体验！

让设备更聪明 |启英泰伦离线自然说，开启智能语音交互新体验！

语音数据集：开启智能语音技术的新篇章