1024 CSDN 程序员节-基于存内计算WTM2101芯片开发板验证语音识别-电子发烧友网

前言
在今年的 CSDN 程序员节上，我参与了这次知存科技举办的一个 AI Workshop 小活动——“基于存内计算芯片开发板验证语音识别”，并且有幸成为完成任务的学习者之一XD。上一次参与类似的活动是算能公司举办的“千校万里行”AIGC 大模型编译部署活动，感觉虽然只是简单的烧录现成代码，经历这几次活动后 AI 小白也能有一个小小的成就感。趁着这股新鲜感还没冷却，我打算写一篇博文来记录下这次活动的一些经历，也供后续参与的童鞋参考~

任务目标
AISHELL-WakeUp-1 数据集是中英文唤醒词语音数据库，命令词为“你好，米雅” “hi, mia” ，语音数据库中唤醒词语音 3936003 条，1561.12 小时，邀请 254 名发言人参与录制。录制过程在真实家居环境中，设置 7 个录音位，使用 6 个圆形 16 路 PDM 麦克风阵列录音板做远讲拾音(16kHz，16bit)、1 个高保真麦克风做近讲拾音(44.1kHz， 16bit)。此数据库可用于声纹识别、语音唤醒识别等研究使用。

本 demo 以该数据集为例，用不同网络结构展示模型训练及移植过程。

我们最终想要通过语音“你好，米雅”唤醒开发板。具体步骤如下：

训练得到模型，并转换为知存科技开发板相应格式模型。
工具链编译模型，得到模型权重表。
烧写模型权重。
烧写代码。
成功运行后，当我们对着开发板说出“你好，米雅”时，开发板就会通过串口发送“已唤醒”的信息。
开发板信息如下：

WTMDK2101-X3 是针对 WTM2101 AI SOC 设计的评估板，包含：

（1） WTM2101 核心板，即我们的存算芯片。

（2）和 I/O 板：WTM2101 运行需要的电源、以及应用 I/O 接口等.

任务步骤
首先，本机上下载训练数据和训练代码并运行。这样我们就得到要烧录到知存开发板上的对应格式的模型。

这一步结束后，我们可以得到以下模型+运行代码：

将代码放入 docker 工具链环境中，编译运行，得到输出的模型权重表：

开发板连接好跳线帽、数据线如下图：

通过烧写工具 WitinProgramTool 将模型权重烧录到开发板上：

通过知存 IDE Witmem Studio，烧录提供好的工程代码。

打开串口调试助手（波特率115200，数据位8，停止位1，无校验位）。若成功运行，此时当我们对着开发板说出“你好，米雅”或 “Hi, Mia” 时，串口便会输出“已唤醒” 的提示信息。

总结
对我个人而言，我接触 AI 非常少，只在前后端、嵌入式领域有过一些涉猎。因此，这次活动虽然在 AI 领域前辈来看可能是比较轻松的一个小任务，不过这份成就感让我很满足，我也大致能理解各个流程的作用。

从今年5月的 ST 峰会上大力推广的边缘AI，7月 RV 峰会上百家争鸣的 AI 应用，这两次算能和知存科技的 AI 硬件体验活动，我逐渐也能感觉到 AI （特别是当下的 AIGC）对嵌入式领域同样不容小觑的影响。现阶段自己的学习还停留在一些简单的控制，RTOS 这些。也许加深一些学习后，未来也可能在嵌入式深度学习领域有所学习~

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
31156

浏览量
269500
数据库

数据库

+关注

关注
7

文章
3827

浏览量
64518
语音识别

语音识别

+关注

关注
38

文章
1742

浏览量
112726
开发板

开发板

+关注

关注
25

文章
5083

浏览量
97730
存内计算

存内计算

+关注

关注
0

文章
30

浏览量
1389

【基于存内计算芯片开发板验证语音识别】训练手册

本教程展现语音识别算法在WTM2101开发板上从训练到部署的全流程，包括实验环境搭建，语音数据集以及算法模型转换烧录。

发表于 05-16 14:49 •674次阅读

【基于<b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b><b class='flag-5'>芯片</b><b class='flag-5'>开发板</b><b class='flag-5'>验证</b><b class='flag-5'>语音</b><b class='flag-5'>识别</b>】训练手册

从MRAM的演进看存内计算的发展

： (1)基于存内计算架构，可高效地实现神经网络语音激活检测和上百条语音命令词识别。 (

发表于 05-17 14:25 •1312次阅读

从MRAM的演进看<b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b>的发展

存内计算WTM2101编译工具链资料

调度到CPU上运算，实现整网的调度，让神经网络开发人员高效快捷的将训练好的算法运行在WTM2101芯片上，极大缩短模型移植的开发周期并提高算法开发

发表于 05-16 16:33

知存科技助力AI应用落地：WTMDK2101-ZT1评估板实地评测与性能揭秘

的挑战。通过对知存科技WTM2101量产芯片的深入解析与评测，重点展示存内计算

发表于 05-16 16:38

长沙1024程序员节求索论道 1024点亮软件定义时代

1024程序员节（别称：程序猿节、码农节，英文名：1024

发表于 10-24 11:01 •5361次阅读

1024程序员节怎么过？带上电脑去旅行！

如果不说，相信很多人都不知道10月24日是什么节日，甚至于节日的主人公“程序员”也不一定会知道。1024程序员节是专门为程序员、工程师等职业

发表于 10-24 16:08 •971次阅读

存内计算的前景如何

知存科技介绍，WTM2101可使用sub-mW级功耗完成大规模深度学习运算，特别适合可穿戴设备中的智能语音和智能健康服务。

发表于 02-09 16:27 •1590次阅读

知存科技WTM2101语音芯片的具备四个优势

WTM2101在运行这类高算力AI算法时，可将功耗降低到微安级别，让仅有数十毫安电池的可穿戴设备同样能够拥有语音唤醒和识别能力。

发表于 04-23 15:15 •1060次阅读

创新成果受肯定，WTM2101芯片亮相中关村论坛多个展区

5月30日，为期5天的中关村论坛展览（科博会）在北京圆满闭幕。知存科技作为存算一体领域代表企业携WTM2101芯片在人工智能展区和中关村科学城展区同步展出，为观众展示先进

发表于 06-07 22:05 •803次阅读

2023 长沙-中国1024程序员节全面启动

，是中国IT行业引领技术前沿、推动应用创新发展的高影响力年度盛会。 2023年10月23-25日，由长沙市人民政府指导，CSDN联合主办的第四届“长沙·中国1024程序员节”将在中国长

发表于 08-28 18:11 •1232次阅读

1024程序员节特别篇 | 知存科技xCSDN北京·杭州双城嘉年华精彩回顾

10月21日，知存科技X CSDN北京·杭州双城嘉年华活动圆满开展，吸引了近百位AI技术爱好者来到活动现场，了解商用存内计算架构

发表于 10-24 10:50 •668次阅读

今天程序员节长沙出招全国首个！长沙为程序员打造“1024街”

今天10月24日，今天程序员节；先给程序员点赞，我们还看到有一些平台举办了程序员节；而在长沙，更有为程序

发表于 10-24 14:29 •679次阅读

喜迎1024程序员节！祝各位开发者们“码”到“程”功！

—— “1024程序员节” 。对于为什么把这个节日定在10月24日，也颇有程序员的“思考模式”：2^10=1024，1GB =

发表于 10-24 20:00 •808次阅读

第五届长沙·中国1024程序员节开幕

场精彩活动将轮番上演。超200名海内外技术人员围绕人工智能、数据技术等前沿领域展开深入研讨。本届1024程序员节中机器人与具身智能、大模型等主题引发热烈讨论；程序员、

发表于 10-25 15:42 •215次阅读

知存科技WTM2101芯片助力导览行业AI新体验

知存科技WTM2101凭借颠覆性的存内计算架构，能够在极低功耗和延时下运行智能语音、智能健康监测

发表于 11-06 15:27 •424次阅读