2017年终解读：语音识别技术今年只走了一半的路

　　这一年，百度开放了语音平台DuerOS，阿里补贴了4个亿销售百万智能音箱抢占语音入口。而作为语音识别的先驱龙头，大家开始担心科大讯飞用近二十年建立起来的技术壁垒被摧毁，有人扒讯飞的业务，有人开始扒讯飞十年的财报。

　　这一年的人工智能大潮，无疑让更多人关注科大讯飞，关心在这样的潮流里，一家深耕语音识别的公司如何能获得更多业务和利润，如何能去迎合AI上升的趋势，从而满足人们对人工智能的所有期望。

　　其实这一年，技术的进程还是和往年一样。（我们从语音识别的角度来解读2017年的进展，部分技术解读来源自对讯飞的采访）。

　　2017，从数据提升开始说起

　　去年IBM、微软、谷歌和百度都发布过自家语音识别进展，而今年对媒体更新词错率进展的有三家：

　　2017年3月，IBM结合了 LSTM 模型和带有 3 个强声学模型的 WaveNet 语言模型。“集中扩展深度学习应用技术终于取得了 5.5% 词错率的突破”。相对应的是去年5月的6.9%。

　　2017年8月，微软发布新的里程碑，通过改进微软语音识别系统中基于神经网络的听觉和语言模型，在去年基础上降低了大约12%的出错率，词错率为5.1%，声称超过专业速记员。相对应的是去年10月的5.9%，声称超过人类。

　　2017年12月，谷歌发布全新端到端语音识别系统（State-of-the-art Speech Recognition With Sequence-to-Sequence Models），词错率降低至5.6%。相对于强大的传统系统有 16% 的性能提升。

　　大家的目标很一致，就是想“超过人类”，之前设定人类词错率为5.9%的这个界线。

　　总结来说，因为Deep CNN引入之后，语音识别取得了很大的突破，例如谷歌从2013年到现在，性能提升了20%。

　　而国内语音识别的企业如百度、搜狗、科大讯飞，识别率都在97%左右。在语音识别这件事情上，汉语比英语早一年超越人类水平。

　　去年，科大讯飞又推出了全新的深度全序列卷积神经网络（DFCNN）语音识别框架，该框架的表现比学术界和工业界最好的双向 RNN 语音识别系统识别率提升了15% 以上。今年，在实际应用领域，讯飞输入法的识别准确率在今年7月份也终于突破了97%，达到了98%。

　　技术“可用”是第一步，但技术最终是要落地的，变成产品和服务才能实现价值。

　　今年技术应用场景有什么变化？

　　今年的产品落地，让人联想到的首先肯定是智能音箱。

　　2016年的数据统计表明，中国智能音箱销售量占全球比重为0.35%，6万：1710万台的差距。在2017年双十一阿里的补贴销售之后，终于可以说“中国智能音箱销量在百万以上”，“中国的智能音箱得到了爆炸式的增长”。但从需求上说，智能音箱的功能集中在听音乐、闹钟、智能家居等，这些功能并不属于国人的“刚需”。BAT巨头都将智能音箱作为语音入口进行抢占，也给了我们一种爆发的假象。

　　但这一年，应用场景无疑是越来越丰富。基于各个领域的应用拓展，智能语音技术已经走出安静的室内或者私人环境，走上了服务大厅、卖场及行驶中的汽车等。技术的应用也越来越深入。机器翻译、远场识别、智能降噪、多轮交互、智能打断等技术的进步，也又给智能语音的应用场景带来了更多的变化。

　　在智能车载领域，2017年科大讯飞发布的飞鱼系统2.0，融合了 Barge-in全双工语音交互技术，窄波束定向识别技术，自然语义理解技术，免唤醒技术，多轮对话技术等科大讯飞核心技术。目前，科大讯飞已经为超过200款车型，累计超过1000万部车辆输出了语音交互产品。

　　此外，在新零售领域，智能语音技术的应用也在不断扩展。比如12月18日，科大讯飞和红星美凯龙发布战略合作计划，未来由科大讯飞研发的智能导购机器人“美美”将在全国红星美凯龙门店上市。

　　语音识别六十年，技术突破总是艰难而缓慢

　　语音识别的研究起源可以追溯到上世纪50年代，AT&T贝尔实验室的Audry系统率先实现了十个英文数字识别。

　　从上世纪60年代开始，CMU的Reddy开始进行连续语音识别的开创性工作。但是这期间进展缓慢，以至于贝尔实验室的约翰·皮尔斯（John Pierce）认为语音识别是几乎不可能实现的事情。

　　上世纪70年代，计算机性能的提升，以及模式识别基础研究的发展，促进了语音识别的发展。IBM、贝尔实验室相继推出了实时的PC端孤立词识别系统。

　　上世纪80年代是语音识别快速发展的时期，引入了隐马尔科夫模型（HMM）。此时语音识别开始从孤立词识别系统向大词汇量连续语音识别系统发展。

　　上世纪90年代是语音识别基本成熟的时期，但是识别效果离实用化还相差甚远，语音识别的研究陷入了瓶颈。

　　关键突破起始于2006年。这一年辛顿（Hinton）提出深度置信网络（DBN），促使了深度神经网络（Deep Neural Network，DNN）研究的复苏，掀起了深度学习的热潮。2009年，辛顿以及他的学生默罕默德（D. Mohamed）将深度神经网络应用于语音的声学建模，在小词汇量连续语音识别数据库TIMIT上获得成功。2011年，微软研究院俞栋、邓力等发表深度神经网络在语音识别上的应用文章，在大词汇量连续语音识别任务上获得突破。国内外巨头大力开展语音识别研究。

　　科大讯飞的智能语音探索之路

　　科大讯飞在2010年首批开展DNN语音识别研究，2011年上线了全球首个中文语音识别DNN系统。2012年，在语音合成领域首创RBM技术。2013年又在语种识别领域首创BN-ivec技术。2014年科大讯飞开始深度布局NLP领域，2015年，RNN语音识别系统全面升级。

　　2016年，上线DFCNN（深度全序列卷积神经网络，Deep Fully Convolutional Neural Network）语音识别系统。在和其他多个技术点结合后，科大讯飞DFCNN的语音识别框架在内部数千小时的中文语音短信听写任务上，相比目前业界最好的语音识别框架双向RNN-CTC系统获得了15%的性能提升，同时结合科大讯飞的HPC平台和多GPU并行加速技术，训练速度也优于传统的双向RNN-CTC系统。DFCNN的提出开辟了语音识别的一片新天地，后续基于DFCNN框架，还将展开更多相关的研究工作。

　　 2017年终解读：语音识别技术今年只走了一半的路

　　（图1）DFCNN的结构如图所示，它直接将一句语音转化成一张语谱图作为输入，即先对每帧语音进行傅里叶变换，再将时间和频率作为图像的两个维度，然后通过非常多的卷积层和池化（pooling）层的组合，对整句语音进行建模，输出单元直接与最终的识别结果比如音节或者汉字相对应。

　　（图2）

　　在语音识别子领域上，今年科大讯飞的智能语音技术所取得的代表性的成就在自然语言理解领域。7月份，哈工大讯飞实验室（HFL）刷新了斯坦福大学发起的SQuAD（Stanford Question Answering Dataset）机器阅读理解挑战赛全球纪录，提交的“基于交互式层叠注意力模型”（Interactive Attention-over-Attention Model）取得了精确匹配77.845%和模糊匹配85.297%的成绩，位列世界第一，也是中国本土研究机构首次取得赛事榜首。

　　语音合成上，暴风雪竞赛（Blizzard Challenge）是国际最权威的语音合成比赛。科大讯飞以语音合成技术率先达到4.0分的成绩并连续12年蝉联全球第一名，这是全世界唯一能让语音合成技术能够达到真人说话水平的系统。5.0分代表播音员的水平，4.0分代表美国普通老百姓的发音水平。

　　在人机交互系统上，科大讯飞于11月发布了AIUI2.0系统，支持远场降噪、方言识别和多轮对话的技术的基础上又增加了主动式对话、多模态交互、自适应、个性化识别等能力并能在嘈杂会场完成全双工翻译功能。

　　而科大讯飞的云端语音开放平台，截至2017年12月，累计终端数达到15亿，日均交互次数达到40亿，开发者团队数已达50万。

　　语音识别还有哪些没有解决的问题？

　　深度学习应用到语音识别领域之后，词错率有显著降低，但是并不代表解决了语音识别的所有问题。认识这些问题，想办法去解决，是语音识别能够取得进步的关键所在，将 ASR（自动语音识别）从“大部分时间仅适用于一部分人”发展到“在任何时候适用于任何人”。

　　1.口音和噪声

　　语音识别中最明显的一个缺陷就是对口音和背景噪声的处理。最直接的原因是大部分的训练数据都是高信噪比、带有口音的语言。比如单是为美式口音英语构建一个高质量的语音识别器就需要 5000 小时以上的转录音频，因而仅凭训练数据很难解决掉这个问题。

　　在中国，口音问题解决得比较好的，是科大讯飞。科大讯飞目前推出了22种方言相关的语音识别系统，但对于那些音素体系与汉语不同的方言或外国语种，在成本问题上还没有很好的办法。

　　2.多人会话

　　每个说话人使用独立的麦克风进行录音，在同一段音频流中不存在多个说话人的语音重叠，这种情况下的语音识别任务比较容易。然而，人类即使在多个说话人同时说话的时候也能够理解说话内容。一个好的会话语音识别器必须能够根据谁在说话对音频进行划分（Diarisation），还应该理解多个说话人语音重叠的音频（声源分离）。

　　在利用语音技术推动输入和交互模式变革的过程中，仍面临这些阻碍。多人对话等场景下的语音识别率虽然很高，声纹识别虽然也已经在实验室实现，但距离实际应用还有一些距离。

　　3.认知智能

　　语音识别技术在质检、安全等方面有很好的应用，但是对于人类所希望达到100%的识别率来说，从科研角度看肯定还有很多需要继续努力的地方。比如减少语义错误、理解上下文上（机器的学习和推理），我们才仅触及皮毛。“ 认知智能有没有真正的突破，是这一轮人工智能热潮——包括产业化热潮——能不能进一步打开天花板、进一步形成更大规模的产业的关键技术所在”，2017年底，科技部正式发文将依托科大讯飞建立首个认知智能国家重点实验室。

　　未来五年内，语音识别领域仍然存在许多开放性和挑战性的问题，如，在新地区、口音、远场和低信噪比语音方面的能力扩展；在识别过程中引入更多的上下文；Diarisation 和声源分离；评价语音识别的语义错误率和创新方法；超低延迟和高效推理等。尽管语音识别目前成果斐然，但剩下的难题和已克服的一样令人生畏。虽然近几年深度神经网络的兴起使得语音识别性能获得了极大的提升，但是我们并不能迷信于现有的技术，总有一天新技术的提出会替代现有的技术。

　　除技术外，一个AI企业的那些事儿

　　人工智能催生了大量新技术、新企业和新业态，人工智能火热背景下，作为A股人工智能龙头股科大讯飞，曾在一个月猛增360多亿元，市值突破千亿。似乎很正契合普通百姓对“AI”神化的认知。

　　2017年11月15日，中国新一代人工智能发展规划暨重大科技项目启动会在京召开，科技部公布我国第一批国家人工智能开放创新平台，包括：1、依托百度公司建设自动驾驶国家新一代人工智能开放创新平台；2、依托阿里云公司建设城市大脑国家新一代人工智能开放创新平台；3、依托腾讯公司建设医疗影像国家新一代人工智能开放创新平台；4、依托科大讯飞公司建设智能语音国家新一代人工智能开放创新平台。作为首批入选国家新一代人工智能开放创新平台，目前的科大讯飞，用刘庆峰的话说是“现在还未到达登顶的状态，只能说是已经开始登山，刚克服了爬坡之后的艰难，开始到慢慢适应的状态”，如同语音识别技术现状。

　　人工智能是个大趋势，本身也是需要很重投入的，但它也会有更长远的影响，所以不能特别短视于此时此刻的回报上。“必须具备了强技术，才能形成刚需”，“就是要把技术做深做透，做到大家真正觉得有刚需”，刘庆峰说，“我们瞄准着五到十年更前沿的技术研究”。

阅读全文

语音识别技术(12774) 语音识别技术(12774)
语音识别(111781) 语音识别(111781)

语音识别技术原理全面解析

语音识别是以语音为研究对象，通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。

2015-06-15 16:22:04

10299

1小时玩转AI语音识别

的海报，便可获得：1、免费观看直播特权2、参与直播互动可得一份【AI语音及人脸识别系统开发文档教程】。本群限时开放400人参加，活动截止到2018年9月20日，福利将在活动结束三个工作日内发放。`

2018-09-19 13:40:42

2012年终总结——电动汽车

2012年，对于电动汽车(包括插电式混合动力汽车、纯电动汽车)来说是一个非常特殊的年份，它既是中国“十城千辆”工程的收官之年，也是全球其它主要汽车生产国电动汽车目标实现的中期考核之年，业界更是把

2013-01-30 09:26:16

2018年预计有150万美国青少年使用智能音箱

购买智能音箱，但这并不能阻止他们花费大量时间使用语音技术。　　eMarketer预计，今年150万名11岁及以下的孩子至少每月使用一次智能音箱，如Amazon Echo或Google Home。到

2018-12-02 09:24:16

2017年A题

2017年A题，三项逆变如何实现呀？求大神指点指点

2017-08-09 11:49:55

2017年“人脸识别”市场很火，但你不知道的还有很多

就能购物、刷脸甚至就能借东西，大家都开始调侃，脸越来越值钱了。所谓的“刷脸”，就是人脸识别识别技术。人脸识别技术，始于20世纪60年代，是基于人的脸部特征信息进行身份识别的一种生物识别技术。人脸识别

2017-09-04 17:14:23

2017双11技术揭秘—阿里巴巴数据库技术架构演进

的0.5亿一路攀升到2017年的1682亿，秒级交易创建峰值达到了32.5万笔/秒。支撑这一切业务指标的背后，是底层技术体系的一次次迭代升级。阿里巴巴数据库系统经历了10多年的发展，今年正式确定从

2018-01-02 16:31:04

一些资料下载一半就停止了

一些资料下载一半就停止了，为什么？

2012-07-25 19:06:57

一文读懂语言识别技术原理1

` 本帖最后由讯飞开放平台于 2018-7-2 08:55 编辑语音识别是十年来发展最快的技术之一，随着AI的不断发展，深度学习让语音识别技术得到了质的飞跃，开始从实验室走向市场，并逐步

2018-06-28 11:27:08

今年最后一波福利！

今年最后一次的大促——华秋年终盛典来啦！[/url][url=https://m.hqchip.com/nianzhongshengdian.html?eleluntan01]>>点击

2021-12-14 10:18:28

语音识别

做了一个语音识别的，很不准确，谁有厉害一点的算法

2020-03-16 21:25:17

语音识别技术的基本原理及应用是什么？

语音识别技术的基本原理是什么？语音识别技术的应用是什么？

2021-05-31 06:50:58

语音识别技术的概念及应用前景

力来进行识别和语义处理，一个常见的智能语音处理流程如下图所示。启英泰伦是行业内首家将人工智能语音处理技术运用到芯片上的公司。2016年推出行业首款人工智能语音芯片，通过芯片上的终端算力，将语音

2023-05-27 09:41:03

语音识别模块

目前市面上语音识别模块哪家识别率比较高，又带语音合成功能？

2015-09-01 15:20:15

语音识别电源供电

`有人玩过科大讯飞的语音识别模块吗？自己画了一块语音识别的底板，其他功能都可以用就是语音输出有底噪，问了科大讯飞技术，说是电源供电问题，需要一个纹波较好的 LDO 供电，参考LP5907，但

2017-12-26 10:25:51

语音识别的现状如何？

语音识别技术的最重大突破是隐含马尔科夫模型Hidden Markov Model的应用。从Baum提出相关数学推理，经过Labiner等人的研究，卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx。此后严格来说语音识别技术并没有脱离HMM框架。

2019-10-08 14:29:52

语音识别设计要素与电路图集锦

语音识别，一项被比做“机器听觉系统”的技术，能够让机器通过识别和理解把语音信号转变为相应的文本或命令，与机器进行语音交流，这在很久以前是人们梦寐以求的事情，但是现在看来，它似乎与我们渐行渐近

2014-12-20 15:52:06

语音接口技术解读

分享了其对这项技术的认识和看法。语音接口是什么？语音识别技术自20世纪50年代起开始出现在我们身边。那时贝尔实验室的工程师创建了一款可以识别单个数字的系统。然而，语音识别只是完整语音接口技术的一

2022-11-14 06:08:42

AD7606的量程只有设定值的一半是为什么？

AD7606的测量范围只有预期的一半

2023-12-04 06:46:23

AI语音识别市场规模怎么样？

语音语义识别是指通过语音信号处理和语义识别，使得计算机自动理解人类口述语言的技术。语音识别主要步骤为信号搜集、降噪、特征提取解码三步，提取的特征在后台由经过语音大数据训练得到的语音模型对其进行解码，最终把语音转化为文本。语义识别则通过自然语言分析，理解人类语言表达的意思。

2019-09-11 11:52:18

CES热门技术：语音识别

”理念，通过语音控制、动作控制和面部识别等技术手段，实现智能用户与智能电视间的互动关联。用户只需要简单地说声“你好，电视”(Hi， TV)就可以开启语音控制，说声“网络浏览器”(Web Browser

2012-02-06 13:27:58

IMX6ULL USB OTG插到PC上可以正常识别出USB设备但是用MFGTool烧写到一半无法继续烧写

IMX6ULL USB OTG插到PC上可以正常识别出USB设备但是用MFGTool烧写到一半无法继续烧写，卡在如下图界面：

2018-05-15 15:47:47

STM32F446驱动屏和SDRAM只有屏显一半图片是正确的

求助！求助！我使用stm32f446使用FMC的SRAM驱动LCD，将图片放在SDRAM中，然后将图片显示在LCD上，但是只有屏显一半图片是正确的，另一半是乱的，在将图片显示=前，将SDRAM中

2018-11-08 09:02:24

【语音识别】你知道什么是离线语音识别和在线语音识别吗?

差距的：离线语音识别：固定词条,不需要连接网络,但是识别率稍低在线语音识别：词条不固定,需要连接网络,识别率较高,但是效果会受网络影响, 价格相对较高产生差距的原因有两点：① 语音识别比较重要的一个因素

2021-04-01 17:11:18

【我的2022】-坚果的2022年终总结

过年吧，虽然有2500公里，但是依旧挡不住自己归家的心。另外明年，大抵是要走相亲的路了，但自己真的不想草草交卷。四、未来规划未来一年我会继续深入研究技术，让自己的技术得到进一步的提升。今年阅读的技术

2023-01-12 07:02:21

【盘点】2017元器件交期年终盘点，2018年最新预测！

）：连接器方面，2017年2月份，圆形连接器的leadtime由40天猛然陡增至75天以上，且于今年下半年一路增长，尚未出现减少的趋势。motors、solenoids、actuators（马达、电磁阀、致动

2018-02-01 15:52:38

中国首个中文离线语音模块标准即将诞生

健康发展的重要性，因此在2017年发起起草该标准，希望能促进离线语音识别控制技术的健康发展。2018年12月21日，中电协下达了第四批制定团体标准计划的通知，轻生活科技发起制定的标准被列入计划，作为

2019-12-18 16:35:22

为什么51单片机做的32路流水灯开电源只有一半（16）灯亮

本帖最后由 eehome 于 2013-1-5 10:03 编辑为什么51单片机做的32路流水灯开电源只有一半（16）灯亮，在从新开一次灯就全亮了，反正开关关后不能停5秒后开，不然还是一半灯亮，5秒内开就正常32灯全亮，求高手

2012-12-12 15:50:36

人工智能语音芯片行业的发展趋势如何？

人工智能是近三年来最受关注的核心基础技术，将深刻的改造各个传统行业。人工智能在图像识别、语音识别领域的应用自2017年来高速发展，是人工智能最热点的两项落地应用。手把手教你设计人工智能芯片及系统（全

2019-09-11 11:52:08

低成本的语音识别方案（离线+在线）整理一下预研思路

本帖最后由 rj496631097 于 2017-3-20 15:56 编辑要求：最近公司各项目都进入了预研定向阶段，我的项目也不例外，今年上司给我安排的项目是设计一个低成本的标准化的语音

2017-03-20 15:56:01

半波整流隔掉一半是什么意思

半波整流，是利用二极管的单向导电性能，整流后将交流电压正半周，或负半周，隔掉一半，所以整流后的电压平均值也是一半隔掉一半是什么意思，这部分电荷去哪里了（小白求助大佬）

2019-10-20 08:54:49

单片机语音识别的原理是什么

语音识别是一门交叉学科。近二十年来，语音识别技术取得显著进步，开始从实验室走向市场。人们预计，未来10年内，语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域

2021-11-17 08:02:48

卧龙会：年底了，我建议你不拿年终奖跳槽！

。原创微信公众号：卧龙会IT技术。这种真不能跳进去。这跳的是火坑啊。不过，不是每家公司都这样，小公司有可能。大公司就不会这样坑人。年终奖就是企业给大家的一种鼓励。年终奖丰厚，说明公司一年的盈利多，你也

2018-01-29 10:07:32

噪声环境下的语音识别技术研究

2012-08-20 12:57:55

基于语音识别做一款能识别语音的App

最近做了一款语音识别的App，想着利用手机控制arduino实现RGB的调节，开发思路：基于讯飞语音识别做一款能识别我们语音的App，识别出文本之后，对应的文字转UTF-8编码，通过蓝牙串口通讯发送到arduino，实现对RGB的控制。...

2022-03-01 07:05:08

基于labview的语音识别

`1系统概述语音识别技术是二十世纪信息技术领域十大重要的科技发展技术之一。语音识别是一门交叉学科，语音识别正逐步成为信息技术中人机交互的关键技术，语音识别技术与语音合成技术结合使人们能够甩掉键盘

2019-03-10 22:00:15

如何设置鸿蒙harmony控件的高度是屏幕的一半?

鸿蒙harmony想让控件的高度是屏幕的一半，该如何设置？在XML和java代码中，分别该如何设置?

2022-03-23 11:09:12

学了一半51单片机，想问

学了一半51单片机，只会根据学的操控来写编程，却看不懂原理图，怎么办啊。学这个，最终是要会电路设计还是会写程序操控单片机

2014-10-11 20:51:03

嵌入式语音识别技术

2016-07-22 20:30:12

嵌入式语音识别技术在80251内核中该如何去实现呢

语音识别技术有哪些应用？嵌入式语音识别技术在80251内核中该如何去实现呢？

2021-12-23 07:42:08

怎么设计基于嵌入式系统的语音口令识别系统？

随着计算机技术和信息技术的迅速发展，语音口令识别已经成为了人机交互的一个重要方式之一。语音口令识别系统将根据人发出的声音、音节或短语给出响应，如通过语音口令控制一些执行机构、控制家用电器的运行或做出

2019-09-03 08:27:23

手机语音识别应用中DSP该怎么选择？

　　随着DSP技术的进步，计算能力更强、功耗更低和体积更小的DSP已经出现，使3G手机上植入更精确更复杂的自动语音识别(ASR)功能成为可能。目前，基本ASR应用可以分成三大类：1. 语音-文本转换(语音输入)；2. 讲者识别；3. 语音命令控制(语音控制)。　

2019-09-02 07:03:35

抓住2015的尾巴，勇敢地晒出你的忧伤—年终奖（活动已结束）

的时候，哭，呜呜……又是一年年底了，小伙伴们，这是最考验老板的时候，今天小编忍痛邀你，晒一晒那些年，我们受过的伤害--年终奖一活动时间：2015.12.22---2015.12.31二参与方式：按

2015-12-22 16:50:48

李洪超硬件工程师_工作六年，如何从 layout 转硬件工程师？丨版主采访（一）精选资料分享

壹2019年接近尾声，按照惯例，在年终，每个人总会被问到一个问题：2019年，你收获了什么？脑海中的影像一一闪回，又是一次年终总结，年龄增长，工龄增多，薪资提高……好像很清楚自己想要什么，好像又很

2021-07-19 06:17:50

模式识别的关键技术

　　1、语音识别技术　　语音识别技术正逐步成为信息技术中人机接口的关键技术，语音技术的应用已经成为一个具有竞争性的新兴高技术产业。中国互联网中心的市场预测：未来5年，中文语音技术领域将会有超过400

2020-12-11 14:17:50

特定人语音识别的方法有哪些？

特定人语音识别的方法有哪些？特定人语音识别技术在汽车控制上的应用是什么？

2021-05-14 06:34:04

监控摄像头画面一半红一半正常

监控摄像头画面一半红一半正常，大佬知道是什么原因吗？

2023-01-03 22:55:36

直播福利：1小时玩转AI语音识别

2018-09-19 13:46:18

福利!EE给大家发年终奖来了

`福利!EE给大家发年终奖来了有一种痛苦叫：辛勤劳动一年，没看到年终奖……..还有一种痛苦叫别人家的年终奖……… 人世间的痛苦莫过于此……. 没有年终奖的人生是有缺的，今年EE帮你补上这个缺。为

2016-01-08 16:22:31

离线语音识别及控制是怎样的技术？

引言：　随着人工智能的飞速发展，离线语音识别技术成为了一项备受瞩目的创新。离线语音识别技术能够将人的语音转化为可理解的文本，无需依赖网络连接，极大地提升了语音识别的便捷性和实用性。　一

2023-11-24 17:41:39

离线语音识别和控制的工作原理及应用

的应用越来越广泛。本文将深入探讨离线语音识别的工作原理，以及其所使用的技术。　　一、离线语音识别的工作原理　　离线语音识别的工作原理包括信号采集、预处理、特征提取和匹配等步骤。下面我们逐一详细介绍这些步骤

2023-11-07 18:01:32

积累的编程知识在十年后将有一半没用

积累的编程知识在十年后将有一半没用【导读】：Ben Northrop 年满 40 岁，本文是他对职业生涯的思考。他认为从长远来看，应该多投资一些不容易过期、衰竭期较长的知识领域中。我是一名程序员

2017-11-21 14:33:55

自动语音识别的原理是什么？

自动语音识别的原理是什么？如何利用WaveNet实现自动语音识别？

2021-06-15 09:14:07

详解语音识别技术原理

声音波形的一个个点了。下图是一个波形的示例。在开始语音识别之前，有时需要把首尾端的静音切除，降低对后续步骤造成的干扰。这个静音切除的操作一般称为VAD，需要用到信号处理的一些技术。要对声音进行分析

2020-05-30 07:41:12

请问stm32f373rct6 flash memory可以分一半做code memory另一半做data memory吗？

stm32f373rct6 flash memory 可以分一半做code memory，另一半做data memory吗？

2022-12-05 06:55:50

请问怎么切断copper pour一半的圆环

做的灯板圆形的，需要20并5串，有一圈的LED是40个需要copper一半，用的copperpour+copperpour cutout--combine后形成整个圆环，需要解决问题我只需要一半的圆环怎么解决，有知道吗？

2019-05-05 09:30:58

请问电销机器人智能语音识别的原理是什么？

个人们最为关心的问题大概就是，电销机器人如何做到语音识别，通俗来讲，就是电销机器人如何“听懂”人们说话？其实语音识别技术是人工智能的一项基础研究，但同时也是多年来一直横亘在研究者面前的一大难关，而不光

2018-06-12 14:03:56

车联网语音识别技术发展与应用

模式”以语音交互和三维手势交互为主的模型，将不同的识别技术与智能终端和用户习惯进行了恰到好处的整合，设计时抛弃一般车载应用附带的路线导航、地点搜索等额外服务，减少功能之间的繁杂切换，满足微博控们随时随地

2013-07-26 15:40:55

连续语音识别网格技术在新闻制播平台的应用

【作者】：张秋野;王力劭;丁鹏;【来源】：《电视技术》2010年02期【摘要】：简要分析连续语音识别技术原理,介绍了语音识别网格构建海量多媒体新闻素材检索系统,该技术显著提升了多媒体新闻制播体系

2010-04-23 11:21:02

选手SHOW｜92年的我为什么不能再创业一次？

和巨头合作，接受了科大讯飞的技术入股，也非常有信心可以一直发展下去。魏佳星始终坚信，青春就是用来拼搏的，时代的浪潮，终不会沉默你我，愿尝尽人间的酸甜苦辣，终不负我们的豪情壮志！02人工智能语音应答

2018-08-09 09:21:46

选择入手森海塞尔IE40 Pro，今年年终奖要更实在

选择入手森海塞尔IE40 Pro，今年年终奖要花的更实在

2020-05-14 12:21:28

什么是语音识别技术

什么是语音识别技术语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术，也就是让机器听懂

2010-03-06 10:35:37

1485

语音识别技术原理简介

语音识别技术原理简介自动语音识别技术(Auto Speech Recognize，简称ASR)所要解决的问题是让计算机能够“听懂”人类的语音，将语音中

2010-03-06 10:38:19

10557

语音识别技术,语音识别技术是什么意思

语音识别技术,语音识别技术是什么意思　语音识别技术，也被称为自动语音识别Automatic Speech Recognition，(ASR)，其目标是将人类的语音

2010-03-06 11:16:45

2783

语音识别,什么是语音识别

语音识别,什么是语音识别语音识别　与机器进行语音交流，让机器明白你说什么，这是人们长期以来

2010-03-06 11:19:25

2537

#硬声创作季 #语音识别语音识别实战-05-6-额外补充-RNN网络模型解读

语音识别

水管工发布于 2022-12-07 18:56:36

#硬声创作季 #语音识别语音识别实战-09-4-声音数据处理模块解读

语音识别

水管工发布于 2022-12-07 18:58:23

#硬声创作季 #语音识别语音识别实战-14-1-论文整体思路与架构解读

语音识别

水管工发布于 2022-12-07 19:00:43

#硬声创作季 #语音识别语音识别实战-20-1-数据与项目文件解读

语音识别

水管工发布于 2022-12-07 19:03:22

#硬声创作季 #语音识别语音识别实战-23-4-生成器构造模块解读

语音识别

水管工发布于 2022-12-07 19:04:44

#硬声创作季 #语音识别语音识别实战-32-3-DeepClustering论文解读

语音识别

水管工发布于 2022-12-07 19:08:55

#硬声创作季 #语音识别语音识别实战-45-3-路径配置与整体流程解读

语音识别

水管工发布于 2022-12-07 19:14:54

科大讯飞新一代语音识别系统解读

今天，我们就为大家从技术上揭秘科大讯飞的新一代语音识别系统。

2016-08-17 14:31:02

3245

语音识别技术原理简介

2017-01-24 16:15:38

国内语音识别技术上市公司汇总_语音识别技术现状_语音识别原理及应用

语音识别技术的发展已经普遍的存在了我们生活当中，本文主要详细介绍了语音识别技术现状，语音识别原理应用以及国内相关语音识别技术上市公司。

2017-12-13 18:04:24

9345

全球最牛语音识别技术的公司有哪些

国外Google、Apple、 MSRA语音识别的基础研究做得比较久，技术上比较好。国内专门做语音识别的有“科大讯飞”和“云知声”，前者是上市公司，发展时间比较长。后者是新成立的公司，但技术上有独到

2017-12-14 17:11:15

53494

语音识别技术是什么_语音识别技术应用领域介绍

语音识别技术，也被称为自动语音识别（ASR），其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。

2018-01-02 18:36:14

16325

一文解读语音识别的运行原理

今天的文章将向您展示如何构建可以识别 10 个不同字词的基本语音识别网络。需要注意的是，真正的语音和音频识别系统要复杂得多，但就像用于识别图像的 MNIST，这个基本语音识别网络能够帮助您基本了解所涉及的技术。

2019-01-01 10:19:00

3645

简析语音识别技术的工作原理

语音识别技术是让机器通过识别把语音信号转变为文本，进而通过理解转变为指令的技术。

2019-12-23 11:20:41

11177

超全语音识别技术概述！

进行语音交流时，让它听明白你在说什么。语音识别技术将人类这一曾经的梦想变成了现实。语音识别就好比“机器的听觉系统”，该技术让机器通过识别和理解，把语音信号转变为相应的文本或命令。语音识别技术，也被称为自动语

2021-03-26 17:47:20

5316

语音识别技术概述

语音识别技术，也被称为自动语音识别AutomaTIc Speech RecogniTIon，(ASR)，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。

2022-04-11 11:28:29

19203

语音识别技术的分类及识别方法

语音识别技术，也被称为自动语音识别Automatic Speech Recognition，(ASR)，（迅捷ocr文字识别软件）其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如

2023-04-13 16:03:19

3697

语音识别唤醒词的技术与应用

词是语音识别技术中的重要组成部分，它的作用是检测语音输入并判断是否包含唤醒词，如果包含则执行相应的指令或响应。语音识别唤醒词的技术是基于机器学习和深度学习算法实现的。通常情况下，唤醒词被设计为一个模型，该模型在训练过程中学习了特定语音指令的特

2023-06-24 04:02:31

742

语音识别技术：原理、应用与未来

一、引言语音识别技术是一种让计算机理解和解析人类语音的方法。这种技术已经存在多年，但随着硬件性能的提升和深度学习算法的发展，语音识别技术在准确性、稳定性和应用范围上都有了显著的提高。本文将深入探讨

2023-09-19 18:30:29

1043

语音识别技术的挑战与机遇

一、引言随着科技的快速发展，语音识别技术成为了人机交互的重要方式。然而，尽管语音识别技术在某些领域已经取得了显著的进步，但在实际应用中仍然存在许多挑战和机遇。本文将探讨语音识别技术的现状、面临

2023-09-20 16:17:19

277

语音识别技术的进步与挑战

一、引言在当今数字化时代，语音识别技术已经成为人机交互的重要方式之一。本文将探讨语音识别技术的历史发展、现有的进步以及面临的挑战。二、语音识别技术的发展历程 1.起步阶段：最初的语音识别技术主要

2023-09-22 18:29:27

413

语音识别技术的挑战与机遇

一、引言语音识别技术是一种将人类语言转化为计算机可理解数据的技术。随着科技的不断发展，语音识别技术面临着诸多挑战，同时也带来了许多机遇。本文将探讨语音识别技术的挑战与机遇。二、语音识别技术的挑战

2023-10-10 17:10:59

467

语音识别技术的应用及优化

一、引言语音识别技术是一种能够让计算机“听懂”人类语言的技术。随着科技的不断发展，语音识别技术的应用范围越来越广泛。本文将探讨语音识别技术的应用及优化方法。二、语音识别技术的应用 1.智能助手

2023-10-10 17:26:45

705

语音识别技术：现状、挑战与未来发展

一、引言语音识别技术是一种将人类语音转化为计算机可读文本的技术，它在许多领域都有广泛的应用，如智能助手、智能家居、医疗诊断等。本文将探讨语音识别技术的现状、挑战和未来发展。二、语音识别技术的现状

2023-10-12 16:57:30

963

已全部加载完成

搜索历史

2017年终解读：语音识别技术今年只走了一半的路

评论