0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

针对智能语音交互的“金耳朵”语音前端处理技术进行了深度分享

fjYQ_ittbank 来源:未知 作者:伍文辉 2017-12-27 17:08 次阅读

人工智能,可以说是今年最热的一个关键词,并推动着很多产品和产业的创新。而提到人工智能,目前主要的还是语音识别和图像识别,这两点也一直是上游芯片原厂和方案商想要突破和创新的技术关卡。

作为国内知名音频芯片厂商炬芯科技,不但于去年在音频领域进入了小米、魅族等几家大公司的供应链,现在也开始聚焦音频AI领域,推出了一系列的智能语音产品和解决方案。12月15日,炬芯科技在深圳举行了针对智能语音技术的专属品牌活动:炬芯科技2017 TcehLife开发者交流大会。

单麦克风or麦克风阵列,语音交互该选用怎样的方案?

本次的TechLife活动交流分享环节,炬芯特邀地平线语音前端处理技术负责人,南京大学声科学与工程系教授,噪声控制与通信声学研究室主任卢晶卢教授,为大家针对智能语音交互的“金耳朵”语音前端处理技术进行了深度分享。

据WER统计,目前最顶尖的语音识别技术的误识率是3%,已经与人类听力的误识率持平,但是WER统计大多数针对安静场景的语音数据,在复杂环境中语音性能显著恶化。人耳能够自动屏蔽掉周围的噪音,只关注你想听到的声音;但是机器做不到,在语音识别系统看来所接收到的所有声音重要性都是一样的,无法区分噪音和声音,在复杂环境下语音识别率自然会下降。

因此,智能语音技术的发展让语音前端处理的重要性日益凸显。不仅要像手机蓝牙耳机、助听器的语音前端处理系统一样实现降噪,还要进一步还原语音,让要让机器听得懂,进而提升语音识别和说话人识别系统的实用性和识别率。

卢晶卢教授表示,目前对干扰噪音的抑制有单麦克风和麦克风阵列两种方案。其中单通道方案的关键点是噪声功率谱的有效追踪和语音边界检测,也可以基于深度学习的方案提升抑制干扰噪声的能力。单通道方案优点是结构简单,硬件成本低,对平稳噪声效果明显,但弱点是对非平稳噪声处理效果不佳。

麦克风阵列由一组按一定几何结构(常用线形、环形)摆放的麦克风组成,对采集的不同空间方向的声音信号进行空时处理,实现噪声抑制、混响去除、人声干扰抑制、声源测向、声源跟踪、阵列增益等功能,进而提高语音信号处理质量,以提高真实环境下的语音识别率。

理论上来说,麦克风数量多多益善,但系统的实现必须考虑性价比。那么,对于开发者来说,该如何平衡语音前端硬件系统的性能和价格呢?卢晶卢教授认为,在一般应用场景,说话人距离3m以内可以采用单麦克风;复杂场景使用2颗;需要DOA估计的复杂场景则需要3-4颗甚至8颗的麦克风。

聚焦音频AI,炬芯推出智能语音全系列产品线

炬芯科技技术专家陶永耀在现场也为大家详细的讲解了炬芯目前的几大核心平台,同时也对智能语音的未来发表了独到的观点。

熟悉炬芯的人都知道,炬芯是做音频起家的,最早做MP3,老人机、小音箱等产品。陶永耀表示,炬芯未来三到五年仍将重点聚焦以音频为主线的三大领域,并引入人工智能元素。一是无线音频和智能穿戴运动耳机;二是智能多媒体,将原来的老人机、游戏机、学习机,与人工智能结合形成跨界的产品。三是智慧计算与物联网,包括无人机VR/AR、OTT盒子等产品。

作为一家芯片厂商,炬芯聚焦解决智能语音平台的共性需求,致力于智能语音交互技术中的前台技术的发展。主要包括以下四点:1.mic阵列语音采集芯片;2整合语音前处理相关算法;3.整合本地语音识别引擎;4.双mic语音前处理模块。

目前炬芯已经拥有非常丰富的智能语音产品线,尤其是目前热门且已经成功落地的智能早教机器人产品。其实在早教机器人方面炬芯已经推出了比较全面的解决方案,完整布局了低、中、高端市场,主要包括ATS3503、ATS3603、ATS3703。

针对火爆的智能音箱市场,炬芯在本次开发者交流大会上正式推出了全新的智能语音多媒体平台。包括面向无屏Linux系统的智能语音平台ATS3605D,面向有屏的Android智能语音平台有S500、S700、S900,以及一颗支持4-8麦的语音采集套片ATT300X。

此外,炬芯还推出了双模蓝牙平台AT3282X和ATB12XX,以及针对BLE蓝牙智能语音平台ATB110X。

此前,炬芯科技CEO周正宇博士被采访表示,人工智能和物联网概念一样的庞大,如果人工智能像物联网一样不追求产品的落地,它将依然得不到人工智能需要追求实际的产品落地和智能化的用户体验,坚持小步快走的微智能化发展方针才是长久之计。炬芯在此次开发者大会上充分展示了智能语音全面的产品线,正是基于其小步快走的微智能化发展方针的最好实践。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30117

    浏览量

    268406
  • 智能语音
    +关注

    关注

    10

    文章

    781

    浏览量

    48708

原文标题:从音频到智能语音,看炬芯AI创新之路

文章出处:【微信号:ittbank,微信公众号:ittbank】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    ASR语音识别技术应用

    语音识别技术应用的分析: 一、ASR语音识别技术原理 ASR语音识别技术的基本原理是将人类
    的头像 发表于 11-18 15:12 291次阅读

    乐鑫声学前端算法:打造智能语音交互新体验,ESP32-S3 SOC技术方案

    随着人工智能技术的不断进步,智能语音设备正逐渐成为我们生活中不可或缺的一部分。然而,在嘈杂的现实环境中,如何实现清晰、准确的语音交互,一直是
    的头像 发表于 08-03 08:04 784次阅读
    乐鑫声学<b class='flag-5'>前端</b>算法:打造<b class='flag-5'>智能</b><b class='flag-5'>语音</b><b class='flag-5'>交互</b>新体验,ESP32-S3 SOC<b class='flag-5'>技术</b>方案

    离线语音控制技术特点

    离线语音控制通过结合高性能的音频前端处理算法和本地AI模型实现了高效的语音识别和控制能力,不依赖于互联网连接,同时具备灵活的应用扩展性。这种解决方案为各种
    的头像 发表于 06-26 18:12 404次阅读
    离线<b class='flag-5'>语音</b>控制<b class='flag-5'>技术</b>特点

    车载语音识别系统语音数据采集标注案例

    的作用。一般来说,车载语音识别系统主要分为前端和后端两个部分,本文将针对前端语音信号数据采集标注进行
    的头像 发表于 06-19 15:52 324次阅读
    车载<b class='flag-5'>语音</b>识别系统<b class='flag-5'>语音</b>数据采集标注案例

    车载语音识别系统语音数据采集标注案例

    的作用。一般来说,车载语音识别系统主要分为前端和后端两个部分,本文将针对前端语音信号数据采集标注进行
    的头像 发表于 06-19 15:49 464次阅读

    智能语音交互技术如何助力设备实现人机自然对话

    随着现代人工智能在各行业的普及,智能语音交互技术也越来越多的在日常工作、生活中应用,智能
    的头像 发表于 05-23 15:16 683次阅读
    <b class='flag-5'>智能</b><b class='flag-5'>语音</b><b class='flag-5'>交互</b><b class='flag-5'>技术</b>如何助力设备实现人机自然对话

    智能语音交互技术如何助力设备实现人机自然对话

    智能语音交互技术是指通过语音识别、语音合成和自然语言理解等
    的头像 发表于 05-23 15:14 357次阅读

    让机器拥有说话能力,智能语音与音频处理SoC

    电子发烧友网报道(文/黄山明)随着生成式AI的推进,已经有越来越多的智能家居企业开始将其加入到产品当中,预计未来也会有更多的家居产品能够通过语音方式与人进行交互。而实现这一
    的头像 发表于 02-02 00:15 2601次阅读

    语音合成技术智能驾驶中的创新与应用

    一、引言 随着智能驾驶技术的不断发展,人机交互变得越来越重要。语音合成技术作为人机交互的重要手段
    的头像 发表于 02-01 18:09 604次阅读

    语音数据集:智能语音技术的燃料与推动力

    随着人工智能技术的不断进步,语音技术作为人机交互的重要方式,正在逐渐渗透到我们的日常生活中。而语音数据集作为
    的头像 发表于 12-29 11:11 379次阅读

    语音数据集:开启智能语音技术的新篇章

    随着人工智能技术的飞速发展,语音数据集在推动智能语音技术的进步中发挥着越来越重要的作用。语音数据
    的头像 发表于 12-29 11:06 631次阅读

    语音数据集:推动人工智能语音技术的关键要素

    随着人工智能技术的飞速发展,语音技术已成为人机交互领域的重要一环。语音数据集作为支撑语音
    的头像 发表于 12-29 11:00 574次阅读

    语音数据集:智能语音技术的基石与挑战

    随着人工智能技术的飞速发展,语音技术已成为人机交互领域的重要突破口。语音数据集作为支撑语音
    的头像 发表于 12-28 11:28 682次阅读

    语音数据集:AI语音技术的灵魂

    一、引言 在人工智能领域,语音技术被誉为“未来人机交互的入口”,而语音数据集则是AI语音
    的头像 发表于 12-14 14:33 978次阅读

    离线语音识别技术:掌控未来的语音交互

    离线语音识别技术的核心优势在于其独立性和实时性。在没有网络连接的情况下,设备依然能够迅速识别用户的语音指令,实现各种功能。这使得语音交互更加
    的头像 发表于 12-13 11:12 550次阅读
    离线<b class='flag-5'>语音</b>识别<b class='flag-5'>技术</b>:掌控未来的<b class='flag-5'>语音</b><b class='flag-5'>交互</b>