语音AI芯片演进至第三阶段，谁将主宰下一个十年？-电子发烧友网

转载自与非网

什么是语音AI 芯片？

语音AI芯片，顾名思义是处理语音的AI芯片。很多人第一次接触语音AI芯片可能是天猫精灵、小爱同学和小度等智能音箱产品，因为在这些产品中，我们可以体验到智能语音的交互，而语音AI芯片是智能语音交互的基础和核心。

都说这几年AI芯片赛道很火，事实上语音识别、自然语义理解（NLP）和机器学习在AI技术中占据重要的位置，是人机交互的基础，而前两项均与语音识别相关，这是因为语音识别不仅方便，而且是人机交互中最符合人类日常交流形态的一种技术，目前已经在智能家居和车载场景得到普遍应用。

为何语音识别要从云端搬至终端？

说到语音识别技术，还要追溯到2010年左右，当时以神经网络为代表的AI技术使得智能语音识别成为可能，并在后来的IoT和AIoT产业浪潮中不断走向成熟。

早期的智能语音识别受限于算力要求，终端没有专用的芯片可以解决算力和功耗成本的均衡问题，无法在终端处理智能语音识别，而云端处理又凭借天然自带内容和服务，模型可以快速迭代，数据收集和训练非常方便等优势，决定了当时的语音识别大都是布置在云端的。

然而，云端的语音识别也有弊端，比如无法做到稳定的实时响应，网络崩溃时更是响应无门；重要的信息都要通过网络传输，有被攻击泄露的风险，无法保障用户隐私安全；此外在成本方面也不具优势，除了持续的带宽消耗外，云端语音需要后台不间断的运行大量服务器来做语音处理，服务器的购置、后续的硬件更换和软件运维、人力费用和电费场地费等都非常昂贵。

图 | 为什么选择离线语音

面对云端语音的优劣势，以启英泰伦为代表的企业开始投入对端侧语音识别的研究。不过，我们知道光有需求点还支撑不起一个新产业的崛起，要养活一个产业需要足够的市场容量，实现资金的活流，才能有利于产品的不断迭代，形成正向循环。

根据艾瑞咨询发布数据显示，2020年中国物联网设备连接量达74亿个，预计2025年将突破150亿个。而麦肯锡则用更动态的数据表示出了物联网的增长率，预估目前每秒大约有127台设备连接到互联网。

然而，面对当前物联网的联网量，华为给出了另一个数据：当前大部分具备物联能力的消费类设备只有 5% ~ 20% 的联接激活率。这是为什么呢？究其原因，还是操作交互太过于复杂。而解决这个复杂问题的方法就是加入更多“老少皆宜”的语音配合IoT连接。

有行业内人士预测，语音AI芯片将会快速发展到5-10亿颗/年左右的市场规模，随着应用面的不断拓宽和渗透率的不断提升，该规模还将持续不断地提升。

综上，不管是场景需求还是市场容量，都在推动端侧语音识别的落地。但如何落地？不是一蹴而就的。

端侧语音识别芯片的三个发展阶段

语音识别面临的挑战和图像识别不同，它对算力要求没那么高，但对算法的要求很高。启英泰伦创始人兼CEO何云鹏告诉与非网：“这是因为语音识别的应用场景非常多，所以各种噪声就非常多样，有稳态噪声，也有非稳态噪声，要在这些环境中进行高准确率的语音识别是非常困难的。所以，必须掌握智能语音算法全链条技术才能实现更好的语音识别，包括智能语音信号前端降噪处理、语音智能识别、语音合成、语音解码、语音大数据处理及训练、NLP等技术。”

当然，语音识别技术在国内的发展也是在不断迭代中变得更加准确和灵活。我们以启英泰伦的三代自研技术平台BNPU（脑神经网络处理器)，来简单概括端侧语音AI芯片的这三个发展阶段。

图 | 启英泰伦在语音AI芯片上的创新

阶段一：语音识别功能

第一代BNPU芯片实现的是端侧语音识别，是行业首款集成神经网络处理器的语音AI芯片，也是离线语音产业应用兴起的标志。

从集成度的角度来看，BNPU 1.0的方案相对分立，方案价格大约在50到90元左右（CI1006）。

阶段二：离线声纹识别+命令词自学习

第二代BNPU芯片（CI1102/CI1103和CI1122），不仅实现了离线语音识别功能，还能实现离线声纹识别和命令词自学习等个性化的功能。在应用上，可以根据不同人的声纹实现基于用户个性喜好的功能配置，并能通过离线命令词的自学习实现在轻度噪声下的地方口音和方言的识别。

从集成度的角度来看，BNPU 2.0集成了Audio CODEC、Flash 等单元，以及双麦阵增强处理能力，方案价格大约在15到25元左右。

阶段三：深度降噪+深度分离+命令词自学习2.0+离线NLP

第三代BNPU芯片，除了继承第二代的语音识别、声纹识别外，还支持了基于深度学习的降噪技术（深度降噪）、人声分离技术（深度分离）、命令词自学习2.0版本技术，以及行业首次突破性的离线NLP技术。在应用上，CI1301可以实现中等噪声中的语音识别，而CI1302、CI1303、CI1306和CI1312则可实现强噪声环境下的语音识别，比如当油烟机噪声高达80dB时，对于70多dB的人声依然可以良好识别。

从集成度的角度来看，BNPU 3.0不仅集成了Audio Codec的模拟 MIC 接口、数字PDM麦克的DMIC接口、通用的ADC和MCU常见的串口、PWM、GPIO等接口，还进一步集成了 4线Nor Flash、3路LDO的PMU和高精度的RC振荡器等，方案价格约10元左右。

对于三代产品的方案价格一代更比一代低的疑问，何云鹏表示：“很多人认为离线语音在端侧、数据处理、语音识别和存储会产生很多的成本，实则云上的成本是持续的，传输的成本是长时间的，这个成本可以避免；此外，云端早期建设的成本很高，很多厂家会建不起，还有每年运营的成本，每台设备每年10多元，这个费用在卖设备的时候厂商会包两年，但后面就要客户自己付费，所以不太公平。而随着摩尔定律的发展，端侧语音识别方案的整体成本已呈现30%的速率下降，已经达到了一个通用MCU的成本。”

除了价格以外，更值得一提的是，原本被认为只有云端才能实现的NLP，现在轻量级的NLP在端侧智能语音芯片中也实现了，并且既保障了用户的体验感，又能降低云端搭建和运营成本，降低网络带宽消耗，也能提升用户使用的安全性。

端云融合才是语音AI芯片的最终归宿

当然，说云端搬到端侧，实际上在很多场景下端侧和云端不是非此即彼的关系，从长期来看，端侧和云端是相互融合、相辅相成的关系。

随着端侧语音芯片功能、性能、可靠性变得越来越强大，价格越来越低，端侧语音识别将实现可靠性、隐私保护、成本和灵活性等多方面的优势，再加上集成联网功能可实现AIOT，从而实现大数据爆发时代下的有效数据分析和场景利用。

以空调为例，传统的空调大都只有调温的功能，但在差异化竞争的今天，大厂空调正在往机器人的方向发展，可以提供更多智慧化的服务，比如调整空气的温湿度、清新程度、含氧量、PM 2.5值，以及在早晨起床时放音乐营造氛围、营养咨询等。而这些服务的基础是语音交互，并且一定是延迟更低、工作更稳定的端侧语音识别，而背后的服务交易、用户的习惯大数据等则更适合放在云端，达到协同的效果。

写在最后

国内语音AI芯片正呈现出爆发式增长的趋势，谁将成为领头者？何云鹏表示：“该市场领域未来发展壮大后，会呈现典型的头部领先市场通吃的局面。而启英泰伦在语料数据、算法模型、芯片架构、AI开发平台及应用方案落地等多维度的迭代已经产生了马太效应。经过长达近7年的发展后，启英泰伦已经积累了B端客户超过5000名，平台开发者超过1万名，使用启英泰伦智能语音平台的在校AI学员则超过10万名。如今，整个离线语音行业快速发展，年内装机量将突破2000万台，未来两年，年出货将朝着1亿台迈进。”

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
31155

浏览量
269500

紫光同创2024年度精彩回顾

这一年，紫光同创开启下一个“十年”。公司始终坚持质量为先的原则，着力赢得客户的信任和认可，管理效能和技术底蕴持续跃升！

发表于 12-31 14:50 •227次阅读

华为预制模块化数据中心连续十年蝉联全球第一

近日，第三方国际权威机构Omdia发布《2023全球预制模块化数据中心报告》，对全球预制模块化数据中心市场动态、市场份额、发展趋势进行洞察和分析。报告显示，2023年华为预制模块化数据中心位居全球市场份额第一，至今已连续

发表于 12-31 11:41 •236次阅读

何小鹏宣布未来十年愿景,加速全球化AI汽车布局

在11月6日的小鹏AI科技日上，小鹏汽车董事长何小鹏分享了公司的宏伟蓝图，即在未来十年内，将小鹏汽车打造成为一家享誉全球的AI汽车公司。　　何小鹏感慨地表示，过去往往是国外的先

发表于 11-07 13:40 •617次阅读

联想集团公布下一阶段Smarter AI for all愿景

全球数字经济领导企业联想集团在Tech World上公布了下一阶段Smarter AI for all愿景，并展示了全面的人工智能解决方案、服务和设备组合，为全球千行百业和千家万户带来了转型和切实的投资回报，同时，联想集团还宣布了一

发表于 10-17 09:13 •573次阅读

使用tSPI协议减少下一个多电机BLDC设计的布线

电子发烧友网站提供《使用tSPI协议减少下一个多电机BLDC设计的布线.pdf》资料免费下载

发表于 09-26 10:40 •0次下载

特斯拉与晶圆厂商或签订十年长单,深化供应链合作

韩国领先的晶圆代工厂商东部高科正积极筹备与美国电动汽车巨头特斯拉签署一项意义重大的长期供货协议，聚焦于电源管理芯片（PMIC）的代工合作。据悉，该合同若顺利获得最终批准，将锁定至少十年的合作期限，目前双方正处于合同签署前的最后验

发表于 09-25 16:08 •1188次阅读

聆思CSK6视觉语音大模型AI开发板入门资源合集（硬件资料、大模型语音/多模态交互/英语评测SDK合集）

大模型语音问答、拍照识图、大模型绘图等丰富供能示例，支持语音唤醒、多轮语音交互。 2智能对话除了大模型语音对话，还集成了可离线运行的坐姿检测算法，是

发表于 06-18 17:33

国产车规级MCU发展进入阶段三，曦华科技如何用“MCU+”引领细分应用赛道

，车规模MCU市场需求明显增加，成为国产MCU厂商重点布局的方向。曦华科技CEO陈曦表示，国产车规级MCU发展有三个阶段：第一个阶段是缺货阶段

发表于 05-29 01:09 •3727次阅读

北京南站启动自动驾驶测试，预计年底提供旅客接驳新选择

继高级别的自动驾驶示范区扩大至第三阶段后，这一新领域场景也随之解锁。北京南站作为一座集铁路、地铁、城市铁路、公交、出租车等多种交通方式于一体

发表于 05-15 14:33 •364次阅读

大电流高效率低温升|18V6A同步降压DCDC转换器TMI3256S

，第二阶段以智能家居、智慧城市等物联网应用为驱动，第三阶段以虚拟现实、超高清视频应用等新一代高速率应用为驱动，而在WiFi7技术标准发展推动下，WiFi技术向第三阶段迈进的步伐日益加快

发表于 04-01 15:30 •566次阅读

【创客营】新品体验！机器视觉VisionBoard开发板免费试用

，将产品快递给入营小伙伴，具体到货时间以实际物流为准。 6. 内容回收：收到开发板后，第一阶段先进行软硬件评测，第二阶段是应用作品设计，第三阶段视频教程制作，需按要求定期上传内容（图文 / 视频）

发表于 03-20 14:03

AI手机时代将至，2024年或成行业转型关键年

从行业发展阶段来看，AI手机也将成为继功能机、智能手机之后，手机行业的第三阶段。

发表于 02-22 09:13 •599次阅读

OPPO宣告AI手机新时代来临，2024年AI手机行业第三阶段成定局

在2024年春节期间，OPPO将举办AI领域的盛大发布会，届时将向OPPO及一加的数千万用户推出全新的ColorOS AI新春版系统，其中包含数百项

发表于 02-18 14:22 •772次阅读

OPPO创始人陈明永：OPPO成立AI中心，加速资源向AI的集中

今日，OPPO创始人兼首席执行官陈明永发表开年致全体员工的一封信。信中表示：2024年是AI手机元年，AI手机时代将成为继功能机、智能手机之后，手机行业的

发表于 02-18 10:18 •472次阅读

商用车将成为下一阶段头部电池企业电动化渗透的重要方向

商用车将成为下一阶段电动化渗透的重要方向。

发表于 01-16 09:39 •882次阅读

搜索历史

语音AI芯片演进至第三阶段，谁将主宰下一个十年？

评论

紫光同创2024年度精彩回顾

华为预制模块化数据中心连续十年蝉联全球第一

何小鹏宣布未来十年愿景,加速全球化AI汽车布局

联想集团公布下一阶段Smarter AI for all愿景

使用tSPI协议减少下一个多电机BLDC设计的布线

特斯拉与晶圆厂商或签订十年长单,深化供应链合作

聆思CSK6视觉语音大模型AI开发板入门资源合集（硬件资料、大模型语音/多模态交互/英语评测SDK合集）

国产车规级MCU发展进入阶段三，曦华科技如何用“MCU+”引领细分应用赛道

北京南站启动自动驾驶测试，预计年底提供旅客接驳新选择

大电流高效率低温升|18V6A同步降压DCDC转换器TMI3256S

【创客营】新品体验！机器视觉VisionBoard开发板免费试用

AI手机时代将至，2024年或成行业转型关键年

OPPO宣告AI手机新时代来临，2024年AI手机行业第三阶段成定局

OPPO创始人陈明永：OPPO成立AI中心，加速资源向AI的集中

商用车将成为下一阶段头部电池企业电动化渗透的重要方向