基于Coretex-M3 Design Start的语音识别和声源定位识别系统-电子发烧友网

写在前面

能获得企业大奖其实是出乎预料的，论复杂程度我自己认为可能也无法比的上其他学校的朋友们的(不过是因为今年没有线下交流，着实无法看到大家的作品)，但我觉得组委会能选择我们组作为企业大奖，可能也是想通过我们来拓宽大家的思路，而并不一定是我们的作品做的是多么完美。

学习了近几年ARM杯的作品，感觉大家都是在同一个领域做文章(当然去年那组BLDC的hxd例外)，那就是视觉和图像处理方面。这方面感觉大家做的都非常好了，无论是用现成的算法拆分成verilog中的矩阵运算，还是利用HLS这类高层次综合工具，我觉得如果继续做视觉方面的内容我们可能再怎么努力也无法达到他人积累多年经验的程度，所以我们选择换一个角度。

人类有五种感官，嗅觉和味觉目前来说无法做到辅助(笑，还剩下听觉、视觉和触觉，视觉被我们直接否定了，那么触觉呢？目前高精度的传感器也不是我们能企及做到的了，这和生物医学电子有关，那么我们的眼前就只有一个选择了：听觉。

这也正是我们选择做这个系统的原因之一，还有一个原因是我们能感觉得到现在的消费电子都逐渐在向声学方面走，例如苹果的HomePod，华为的Sound X，还有小米最近刚推出的小米Sound，这些都是非常高端的走计算声学方向的家居产品，它们的受众非常广，而且在这两年疫情的影响下，更多的人会选择在线会议，那么一个优秀的声学处理装置就显得更为重要了。

1.设计简介

1.1 总体介绍

本作品是基于Coretex-M3 Design Start的语音识别和声源定位识别系统，包括Digilent NexysVideo开发板、自制麦克风矩阵模块、ESP8266无线互联模块、LCD屏幕、载体小车以及安卓端APP组成。

本系统在Xilinx Artix-7中搭建ARM Cortex-M3软核作为中央处理器，使用自制的MEMS硅片麦克风阵列作为声音信号采集器，利用Artix-7中自带的XADC将麦克风输出的模拟量信号转换为数字信号并通过AXI4-FULL传输给DDR3控制器，DDR3控制器根据用户的控制选择输入和输出，当开始语音识别后，将开启后1s内的数据从DDR3中直接利用Burst读入语音识别模块，该模块利用HLS综合，包括语音的MFCC特征提取、BP神经网络的执行等过程，将最终得出的语音识别结果保存在寄存器中并能使CPU通过AXI4-Lite读取；当开启声源定位后，数据利用AXI4-Stream直接搬移到算法电路模块，对四路麦克风同时进行流水线处理，经过信号的处理和变换后得到声源方位数据通过UART串口输出到ESP8266，ESP8266利用局域网将数据传至安卓APP。

有一点我们的体会可以分享给其他朋友们，如果我们在一段时间内只需要处理一段定长的数据，那么我们可以不利用DMA，而是仅仅利用AXI的Burst传输即可，例如采集1s的信号寸到DDR中一段连续区域以后，将这些的音频信号数据整个Burst到加速器中，这样可以充分发挥总线桥的作用，并节省一个DMA的资源，还可以减小数据搬移过来过去的时延。

1.2 硬件架构

在本系统中，由于最终制作的语音识别加速器和声源定位加速器都使用AXI系列总线配置寄存器和读写数据，同时DDR3由AXI总线接口的MIG管理，因此为了方便实用和同一总线，使整个架构简洁，我们将除了ITCM和DTCM外的所有外设连接在由AHB转换之后的AXI总线桥上。

1.3 语音识别加速器

语音识别采用的方案是利用MFCC提取特征，之后利用BP神经网络拟合特征系数对应的神经网络隐含层参数。首先输入的语音数据从DDR经过Burst传输到信号处理模块中，经过预处理(去工频噪声、音量均衡)后提取MFCC，再利用BP网络将MFCC系数与训练过的语句一一对应输出对应的结果。语音识别的网络的权重参数采用的是MATLAB离线训练的方法，然后把训练的权重数据保存在coe文件中，利用HLS综合出IP。

流程图如下：

1.4 声源定位加速器

声源定位加速器融合了TDOA(Time Difference of Arrival 到达时间差)和空域波束指向性加权的方法。

由四个全向性麦克风M1, M2, M3, M4组成的差分麦克风列，如图2.10所示。四麦克风等间隔的分布在直径为D的圆周上。

差分麦克风阵列的输出信号包括原点处的声压信号和原点处振速的两个正交分量，可以得到声源在原点处的声强，进而由声强的方向得到目标方位的估计值。需要指出的是，基于声强估计的声源定位方法通常只适用于单声源的情况。同时，对于全向麦克风而言(不同于“心”形指向麦克风)，并没有对特定角度的声源信号进行增强或削弱，这就使得在进行声源定位时往往受到其他方向的干扰。采用空域波束指向性加权的方法，可以只增强期望方向上的信号，削弱其他方向上的干扰信号，提高信干比，使得输出结果中特定方向上的信息能量增大。

2.作品外观和使用体验

作品成品外观如下：

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

语音识别

语音识别

+关注

关注
38

文章
1745

浏览量
113015
识别系统

识别系统

+关注

关注
1

文章
138

浏览量
18864
CORETEX

CORETEX

+关注

关注
0

文章
2

浏览量
6333

原文标题：【2021集创赛作品分享】第三期 | Cortex-M3语音识别声源定位系统

文章出处：【微信号：Ithingedu，微信公众号：安芯教育科技】欢迎添加关注！文章转载请注明出处。

雷卯针对远场六麦克风阵列板科大讯飞6语音识别模块防护示意图

一、应用场景 1. 实时翻译 2. 会议定向录音 3. TTS文字转音频 4. 声源定位 5. 回声消除 6. 离线语音识别 7. 音频降噪

发表于 02-10 10:43 •114次阅读

雷卯针对远场六麦克风阵列板科大讯飞6<b class='flag-5'>语音</b><b class='flag-5'>识别</b>模块防护示意图

新唐科技基于NuMaker-M55M1平台的人脸识别系统

人脸识别技术已成为现代科技的重要基石，广泛应用于安全监控、门禁系统以及用户身份认证等领域。新唐科技基于 NuMaker-M55M1 平台的人脸识别系统，结合多种核心技术组件，包括图像处

发表于 01-20 10:31 •199次阅读

几款性价比很不错的门禁人脸识别系统及其常见应用

在当今智能化时代，门禁系统作为安全管理的重要一环，正逐步向更高效、更便捷的人脸识别技术转型。其中，远景达物联网推出的F3与F6门禁人脸识别系统，凭借其卓越的性能与广泛的应用领域，成为了

发表于 01-03 14:49 •199次阅读

几款性价比很不错的门禁人脸<b class='flag-5'>识别系统</b>及其常见应用

基于语音识别的智能会议系统具备哪些交互功能

标贝科技专注智能语音交互领域多年，在语音识别和语音合成领域有着多项大型企业合作案例，标贝与多个智能会议系统厂商合作，成功将

发表于 12-20 10:35 •242次阅读

RFID识别系统

随着信息技术的快速发展，RFID（射频识别）技术在各行各业的应用日益广泛，其中RFID识别系统作为核心应用，已经成为智能化管理不可或缺的基石。通过无线射频信号的非接触式识别与数据传输，RFID

发表于 12-06 17:57 •379次阅读

物联网系统智能控制产品的语音识别方案_离线语音识别芯片分析

01 物联网系统中为什么要使用离线语音识别芯片物联网系统中使用离线语音识别芯片的原因主要基于以

发表于 09-26 17:56 •843次阅读

WTK6900FC语音识别模块

语音识别

WT-深圳唯创知音电子有限公司
发布于 :2024年09月25日 17:35:07

智能玩具用离线语音识别芯片有什么优势

的语音识别系统，应用场景相对单一。典型应用：智能家电、语音遥控器、智能玩具、车载声控、智能家居等当离线语音识别芯片应用在智能玩具中，能够提供

发表于 09-20 10:00 •352次阅读

基于FPGA的指纹识别系统设计

随着人们对安全问题的日益重视，指纹识别作为一种高效、可靠的生物识别技术，在多个领域得到了广泛应用。本文设计并实现了一种基于FPGA的嵌入式指纹识别系统，该系统利用FPGA的高集成度、低

发表于 07-17 16:33 •1532次阅读

多目标智能识别系统

智慧华盛恒辉多目标智能识别系统是一种利用现代计算机视觉技术和人工智能算法，从图像或视频中同时识别和分类多个目标物体的系统。这种系统广泛应用于自动驾驶、智能监控、人机交互、军事侦察、灾害

发表于 07-16 10:42 •1.7w次阅读

基于OpenCV的人脸识别系统设计

基于OpenCV的人脸识别系统是一个复杂但功能强大的系统，广泛应用于安全监控、人机交互、智能家居等多个领域。下面将详细介绍基于OpenCV的人脸识别系统的基本原理、实现步骤，并附上具体的代码示例。

发表于 07-11 15:37 •1.6w次阅读

语音识别和自然语言处理的区别和联系

Recognition） 1. 定义语音识别，又称为自动语音识别（Automatic Speech Recognition, ASR），是指将人类的

发表于 07-05 10:09 •2072次阅读

基于GIS的SAR多目标智能识别系统

智慧华盛恒辉基于GIS的SAR多目标智能识别系统是一个集成了合成孔径雷达(SAR)和地理信息系统(GIS)技术的先进系统，旨在实现高分辨率雷达图像中的多目标智能识别。以下是该

发表于 06-26 14:26 •577次阅读

车载语音识别系统语音数据采集标注案例

车载语音识别系统是指利用机器学习算法实现的一种自然语言处理技术，载语音识别系统通过辨别声音的语调、语速和音量，将所听到的语音转化成可读取的语

发表于 06-19 15:52 •427次阅读

车载语音识别系统语音数据采集标注案例

车载语音识别系统是指利用机器学习算法实现的一种自然语言处理技术，载语音识别系统通过辨别声音的语调、语速和音量，将所听到的语音转化成可读取的语

发表于 06-19 15:49 •597次阅读

搜索历史

基于Coretex-M3 Design Start的语音识别和声源定位识别系统

评论

雷卯针对远场六麦克风阵列板科大讯飞6语音识别模块防护示意图

新唐科技基于NuMaker-M55M1平台的人脸识别系统

几款性价比很不错的门禁人脸识别系统及其常见应用

基于语音识别的智能会议系统具备哪些交互功能

RFID识别系统

物联网系统智能控制产品的语音识别方案_离线语音识别芯片分析

WTK6900FC语音识别模块

智能玩具用离线语音识别芯片有什么优势

基于FPGA的指纹识别系统设计

多目标智能识别系统

基于OpenCV的人脸识别系统设计

语音识别和自然语言处理的区别和联系

基于GIS的SAR多目标智能识别系统

车载语音识别系统语音数据采集标注案例

车载语音识别系统语音数据采集标注案例