针对智能语音交互的“金耳朵”语音前端处理技术进行了深度分享-电子发烧友网

人工智能，可以说是今年最热的一个关键词，并推动着很多产品和产业的创新。而提到人工智能，目前主要的还是语音识别和图像识别，这两点也一直是上游芯片原厂和方案商想要突破和创新的技术关卡。

作为国内知名的音频芯片厂商炬芯科技，不但于去年在音频领域进入了小米、魅族等几家大公司的供应链，现在也开始聚焦音频AI领域，推出了一系列的智能语音产品和解决方案。12月15日，炬芯科技在深圳举行了针对智能语音技术的专属品牌活动：炬芯科技2017 TcehLife开发者交流大会。

单麦克风or麦克风阵列，语音交互该选用怎样的方案？

本次的TechLife活动交流分享环节，炬芯特邀地平线语音前端处理技术负责人，南京大学声科学与工程系教授，噪声控制与通信声学研究室主任卢晶卢教授，为大家针对智能语音交互的“金耳朵”语音前端处理技术进行了深度分享。

据WER统计，目前最顶尖的语音识别技术的误识率是3%，已经与人类听力的误识率持平，但是WER统计大多数针对安静场景的语音数据，在复杂环境中语音性能显著恶化。人耳能够自动屏蔽掉周围的噪音，只关注你想听到的声音；但是机器做不到，在语音识别系统看来所接收到的所有声音重要性都是一样的，无法区分噪音和声音，在复杂环境下语音识别率自然会下降。

因此，智能语音技术的发展让语音前端处理的重要性日益凸显。不仅要像手机、蓝牙耳机、助听器的语音前端处理系统一样实现降噪，还要进一步还原语音，让要让机器听得懂，进而提升语音识别和说话人识别系统的实用性和识别率。

卢晶卢教授表示，目前对干扰噪音的抑制有单麦克风和麦克风阵列两种方案。其中单通道方案的关键点是噪声功率谱的有效追踪和语音边界检测，也可以基于深度学习的方案提升抑制干扰噪声的能力。单通道方案优点是结构简单，硬件成本低，对平稳噪声效果明显，但弱点是对非平稳噪声处理效果不佳。

麦克风阵列由一组按一定几何结构（常用线形、环形）摆放的麦克风组成，对采集的不同空间方向的声音信号进行空时处理，实现噪声抑制、混响去除、人声干扰抑制、声源测向、声源跟踪、阵列增益等功能，进而提高语音信号处理质量，以提高真实环境下的语音识别率。

理论上来说，麦克风数量多多益善，但系统的实现必须考虑性价比。那么，对于开发者来说，该如何平衡语音前端硬件系统的性能和价格呢？卢晶卢教授认为，在一般应用场景，说话人距离3m以内可以采用单麦克风；复杂场景使用2颗；需要DOA估计的复杂场景则需要3-4颗甚至8颗的麦克风。

聚焦音频AI，炬芯推出智能语音全系列产品线

炬芯科技技术专家陶永耀在现场也为大家详细的讲解了炬芯目前的几大核心平台，同时也对智能语音的未来发表了独到的观点。

熟悉炬芯的人都知道，炬芯是做音频起家的，最早做MP3，老人机、小音箱等产品。陶永耀表示，炬芯未来三到五年仍将重点聚焦以音频为主线的三大领域，并引入人工智能元素。一是无线音频和智能穿戴运动耳机；二是智能多媒体，将原来的老人机、游戏机、学习机，与人工智能结合形成跨界的产品。三是智慧计算与物联网，包括无人机、VR/AR、OTT盒子等产品。

作为一家芯片厂商，炬芯聚焦解决智能语音平台的共性需求，致力于智能语音交互技术中的前台技术的发展。主要包括以下四点：1.mic阵列语音采集芯片；2整合语音前处理相关算法；3.整合本地语音识别引擎；4.双mic语音前处理模块。

目前炬芯已经拥有非常丰富的智能语音产品线，尤其是目前热门且已经成功落地的智能早教机器人产品。其实在早教机器人方面炬芯已经推出了比较全面的解决方案，完整布局了低、中、高端市场，主要包括ATS3503、ATS3603、ATS3703。

针对火爆的智能音箱市场，炬芯在本次开发者交流大会上正式推出了全新的智能语音多媒体平台。包括面向无屏Linux系统的智能语音平台ATS3605D，面向有屏的Android智能语音平台有S500、S700、S900，以及一颗支持4-8麦的语音采集套片ATT300X。

此外，炬芯还推出了双模蓝牙平台AT3282X和ATB12XX，以及针对BLE蓝牙智能语音平台ATB110X。

此前，炬芯科技CEO周正宇博士被采访表示，人工智能和物联网概念一样的庞大，如果人工智能像物联网一样不追求产品的落地，它将依然得不到人工智能需要追求实际的产品落地和智能化的用户体验，坚持小步快走的微智能化发展方针才是长久之计。炬芯在此次开发者大会上充分展示了智能语音全面的产品线，正是基于其小步快走的微智能化发展方针的最好实践。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
31092

浏览量
269415
智能语音

智能语音

+关注

关注
10

文章
786

浏览量
48810

原文标题：从音频到智能语音，看炬芯AI创新之路

文章出处：【微信号：ittbank，微信公众号：ittbank】欢迎添加关注！文章转载请注明出处。

【「嵌入式系统设计与实现」阅读体验】+ 基于语音识别的智能杯垫

项目二维码下图该作品通过采集饮水数据，多种交互方式，数据分析处理，提醒用户定期饮水，达到保持健康的作用。主要功能是语音识别。 ASR-PRO语音模块是一款高度集成的

发表于 01-02 18:15

解锁个性化语音交互新时代：九芯智能语音云平台，让创意声音触手可及！

九芯智能语音云平台提供全面高效安全的智能语音服务，支持自定义语音内容，简化烧录流程，依托AI技术

发表于 01-02 16:51 •103次阅读

解锁个性化<b class='flag-5'>语音</b><b class='flag-5'>交互</b>新时代：九芯<b class='flag-5'>智能</b><b class='flag-5'>语音</b>云平台，让创意声音触手可及！

基于语音识别的智能会议系统具备哪些交互功能

标贝科技专注智能语音交互领域多年，在语音识别和语音合成领域有着多项大型企业合作案例，标贝与多个智能

发表于 12-20 10:35 •143次阅读

基于智能语音交互的智能呼叫中心工作机制

作为实现智能呼叫中心的关键技术之一的智能语音交互技术，它通过集成自然语言

发表于 12-03 16:44 •318次阅读

智能语音的驱动力：揭秘8脚语音芯片在智能设备中的非凡角色

语音技术渗透生活，8脚语音芯片以微缩体积、低功耗、卓越性能成智能设备语音功能核心，集成识别、合成、压缩解码等功能，实现精准

发表于 12-02 14:23 •175次阅读

语音识别与自然语言处理的关系

在人工智能的快速发展中，语音识别和自然语言处理（NLP）成为了两个重要的技术支柱。语音识别技术使

发表于 11-26 09:21 •453次阅读

ASR语音识别技术应用

语音识别技术应用的分析：一、ASR语音识别技术原理 ASR语音识别技术的基本原理是将人类

发表于 11-18 15:12 •795次阅读

乐鑫声学前端算法：打造智能语音交互新体验，ESP32-S3 SOC技术方案

随着人工智能技术的不断进步，智能语音设备正逐渐成为我们生活中不可或缺的一部分。然而，在嘈杂的现实环境中，如何实现清晰、准确的语音交互，一直是

发表于 08-03 08:04 •1027次阅读

离线语音控制技术特点

离线语音控制通过结合高性能的音频前端处理算法和本地AI模型实现了高效的语音识别和控制能力，不依赖于互联网连接，同时具备灵活的应用扩展性。这种解决方案为各种

发表于 06-26 18:12 •511次阅读

车载语音识别系统语音数据采集标注案例

的作用。一般来说，车载语音识别系统主要分为前端和后端两个部分，本文将针对前端语音信号数据采集标注进行

发表于 06-19 15:52 •372次阅读

车载语音识别系统语音数据采集标注案例

的作用。一般来说，车载语音识别系统主要分为前端和后端两个部分，本文将针对前端语音信号数据采集标注进行

发表于 06-19 15:49 •523次阅读

智能语音交互技术如何助力设备实现人机自然对话

随着现代人工智能在各行业的普及，智能语音交互技术也越来越多的在日常工作、生活中应用，智能

发表于 05-23 15:16 •734次阅读

智能语音交互技术如何助力设备实现人机自然对话

智能语音交互技术是指通过语音识别、语音合成和自然语言理解等技

发表于 05-23 15:14 •390次阅读

让机器拥有说话能力，智能语音与音频处理SoC

电子发烧友网报道（文/黄山明）随着生成式AI的推进，已经有越来越多的智能家居企业开始将其加入到产品当中，预计未来也会有更多的家居产品能够通过语音方式与人进行交互。而实现这一

发表于 02-02 00:15 •2795次阅读

语音合成技术在智能驾驶中的创新与应用

一、引言随着智能驾驶技术的不断发展，人机交互变得越来越重要。语音合成技术作为人机交互的重要手段

发表于 02-01 18:09 •670次阅读