0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

【基于存内计算芯片开发板验证语音识别】训练手册

廖慧敏 来源:jf_13681693 作者:jf_13681693 2024-05-16 14:49 次阅读

实验环境搭建
模块⼀:软件包下载及环境搭建
步骤一:搭建docker、mappper环境:

Linux下通过Docker直接下载,获取指令:

docker pull witin/toolchain:v001.000.034

②Window环境,可以通过docker desktop来使用docker:

下载安装Docker desktop(win10或以上):
通常需要更新WSL,下载链接如下,更新后需要重启生效
旧版 WSL 的手动安装步骤 | Microsoft Learn

3.Docker desktop 基本使用教程

Docker-desktop(Docker桌面版)——入门篇_dockerdesktop干嘛用的-CSDN博客

4.Docker desktop通常默认安装在c:Program Filedocker,可以通过软连接的形式修改Docker安装路径:

如何将Docker(Windows桌面版)自定义安装目录_自定义docker安装路径-CSDN博客

5.在Docker desktop里,可以通过搜索获得witin_toolchain,我们需要的是034版本(ps:Hub反应慢可以开VPN获取,或者使用镜像路径,具体操作方式见3链接)

wKgZomZFqLaAOx5LAAZ26TrJ9pE914.png

6.测试:

①:管理员模式下打开命令行窗口

docker run -it --name XXXX witin/toolchain:v001.000.034

②:默认进入workspace目录下,可以进入witin_mapper下执行测试脚本:

cd witin_mapper

python3

tests/python/frontend/onnx/witin/wtm2101/precision/XXXX.py

wKgZomZFqMuADv8wAA-VcBphBfo127.png

③:使用exit退出,再次进入可按如下操作:

④:通过docker ps -a获取容器id,然后打开进入容器

wKgZomZFqNuAO1vqAAj4zB8ouzg752.png

步骤二:搭建IDE环境

①预先下载安装包,下载安装

②默认安装路径,直接点击安装

③从主菜单的File->Open…菜单,或者点击工具栏的按钮,打开选择文件对话框,选择要打开的项目文件,即***.wmproject文件即可,点击【打开】按钮即可打开工程。如下图所示。

wKgaomZFqOqAWHR5AAZZ6oZe1jM247.png

步骤三:其他需要安装的软件

① 请确保安装以下环境:python, git, pytorch

步骤四:下载训练数据

最新数据集在软件安装包中

工程软件安装包:https://download.csdn.net/download/m0_58966968/88602575

实验环境安装包:https://download.csdn.net/download/m0_58966968/88602555

动⼿实验: 简单语音识别系统开发
模块⼀:简介
WTMDK2101-X3介绍
WTMDK2101-X3是针对WTM2101 AI SOC设计的评估板,包含:

(1)WTM2101核心板,即我们的存算芯片

(2)和I/O 板:WTM2101运行需要的电源、以及应用I/O接口等.

wKgZomZFqQaAFGaqAAFm7enW90g219.png

核心板示意图

wKgZomZFqRyAB_GmABEO-OwL8N8959.png

WTMDK2101-X3 I/O 板示意图

2, AISHELL-WakeUp-1数据集介绍

AISHELL-WakeUp-1数据集是中英文唤醒词语音数据库,命令词为“你好,米雅” “hi, mia”,语音数据库中唤醒词语音3936003条,1561.12小时,邀请254名发言人参与录制。录制过程在真实家居环境中,设置7个录音位,使用6个圆形16路PDM麦克风阵列录音板做远讲拾音(16kHz,16bit)、1个高保真麦克风做近讲拾音(44.1kHz,16bit)。此数据库可用于声纹识别、语音唤醒识别等研究使用。

本demo以该数据集为例,用不同网络结构展示模型训练及移植过程。

模块⼆:搭建算法训练工程,完成算法训练与量化
模型训练工程搭建:
本demo提供DNN和DNN_DEEP两种网络结构的示例,网络结构如下,本教程以DNN为例。

wKgaomZFqTOAGpoRAAEBapB5vNg042.png

DNN

步骤一:配置python/config.py,参数释义见代码注释。

步骤二:运行python/train.py,模型训练完毕后,在models/net_type文件夹下生成bestModel.pth,此即我们的模型权重。

步骤三:运行python/onnx_converter.py,在models/net_type文件夹下生成bestModel.onnx。此步骤即完成原始模型到知存onnx格式模型的转换。

模块三:算法模型转换
1,Dcoker下Mapper转换流程

步骤一:拷贝至指定文件夹

我们将mapper/input 拷贝至witin/toolchain:v001.000.034的指定文件夹下(通常为/home,需与gen_mapper.py文件里描述一致)

wKgZomZFqUyAN3hUAAL8s_jv3Pw704.png

步骤二:在workplacewitin_mapper下执行gen_mapper.py

docker start id

docker attach id

cd witin_mapper

python3 /home/mapper/input/gen_mapper.py

wKgaomZFqVuAcogTAAl4orUuQxQ896.png

步骤三:在对应的output文件下获得输出

wKgaomZFqWmALGMlAAIVkYHZF1Q101.png

模块四:算法模型烧写
步骤一:系统连接:

进行模型烧录和开发时,我们需要将JTAG,核心板,NPU烧写板连接好,并打开开关,如系统连接示意图所示。

步骤二:

wKgaomZFqXeAQa7aAAT5Hy7-MuA316.png

系统连接示意图

步骤三:跳线帽连接:

如跳线帽连接示意图所示,按照红框标注进行跳线连接。含义解释:

wKgZomZFqZqAAKHXAAGEWMT54oo773.pngwKgaomZFqbSAP9gsAA0n2CpyASw463.png

跳线帽连接示意图

步骤四:

使用project/ WitinProgramTool_WTM2101下的WitinProgramTool.exe进行模型权重烧写。烧写时的开发板接线请参考其他文档。

步骤五:烧写指令:

.WitinProgramTool.exe -m init

.WitinProgramTool.exe -m program -i XXXXmap.csv -k 2

其中XXXX为步骤2.(3)中生成的mapper/output/map

示例:

wKgZomZFqeCAcq-CAAHr8lir510028.png

模块五:算法模型在芯片运行推理
步骤一:

从官网下载知存IDE Witmem Studio。

步骤二:

生成的mapper/output/register.c放在project/Model,使用Witmem Studio打开project/Project/SES-RISCV/Demo.wmproject。

wKgaomZFqfiAIxTEAADv3LpPdeg826.png

步骤三:Target->Download下载工程:

wKgZomZFqgOAKZ-PAAEI4A7zJKI417.png

注:本demo所用为x3开发板,所用串口GPIO为16,17。若是其他开发板,请根据情况修改串口。

步骤四:

打开tools中的串口工具,设置波特率115200,查看准确率输出

wKgZomZFqhOAASsqAAtr3UIkR8I010.png

至此,我们完成了基于存内计算X3开发板的语音识别从训练到部署全流程,本教程结束。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    455

    文章

    50714

    浏览量

    423152
  • 语音识别
    +关注

    关注

    38

    文章

    1739

    浏览量

    112634
  • 开发板
    +关注

    关注

    25

    文章

    5032

    浏览量

    97375
  • 算法模型
    +关注

    关注

    0

    文章

    7

    浏览量

    6736
  • 存内计算
    +关注

    关注

    0

    文章

    30

    浏览量

    1378
收藏 人收藏

    评论

    相关推荐

    计算技术工具链——量化篇

    本篇文章将重点讲述计算技术工具链之“量化”,我们将从面向计算
    的头像 发表于 05-16 12:35 1211次阅读
    <b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b>技术工具链——量化篇

    计算原理分类——数字计算与模拟计算

    数字计算与模拟计算各有优劣,都是算一体发展
    的头像 发表于 05-21 16:26 2480次阅读
    <b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b>原理分类——数字<b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b>与模拟<b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b>

    1024 CSDN 程序员节-基于计算WTM2101芯片开发板验证语音识别

    整体流程为 训练得到模型,并转换为知科技开发板相应格式模型。工具链编译模型,得到模型权重表。烧写模型权重。烧写代码。成功运行后,当我们对着开发板说出“你好,米雅”时,
    的头像 发表于 05-20 16:01 876次阅读
    1024 CSDN 程序员节-基于<b class='flag-5'>存</b><b class='flag-5'>内</b><b class='flag-5'>计算</b>WTM2101<b class='flag-5'>芯片</b><b class='flag-5'>开发板</b><b class='flag-5'>验证</b><b class='flag-5'>语音</b><b class='flag-5'>识别</b>

    计算WTM2101编译工具链 资料

    计算是突破物理极限的下一代算力技术- AIGC等人工智能新兴产业的快速发展离不开算力,算力的基础是人工智能芯片。 当前CPU/GPU在执行计算
    发表于 05-16 16:33

    浅谈计算生态环境搭建以及软件开发

    计算图 通过开发人员的努力,Apache Spark和TensorFlow不仅能够提高数据处理和机器学习模型训练的速度,还能在能耗和性能方面取得显著改进。这些进展在软件开发领域展示了
    发表于 05-16 16:40

    龙邱Lark7618语音识别开发板套件手册

    `产品特点:龙邱Lark7618语音识别开发板是一款集好玩、好学、实用于一体的语音识别交互开发板,是未来智能领域
    发表于 05-09 14:40

    【龙邱Lark7618语音识别开发板免费试用】开发板申请项目计划

    1,龙邱Lark7618语音识别开发板有arduino接口,可以结合arduino开发板mbot小车进行MCU控制;2.有stm32,arduino开发板编程经验,熟悉C、arduin
    发表于 06-06 13:54

    【 平头哥CB5654语音开发板试用连载】智能门禁语音识别

    ①根据CB5654文档,对异构双核AI语音开发板快速熟悉②通过学习AI语音开发板快的软件和系统,了解AI语音
    发表于 03-13 16:20

    【1024平头哥开发套件开发体验】 语音识别开发板的比较

    随着语音识别技术的发展,带有语音识别处理功能的开发板也逐渐丰富起来,目前供用户进行测评的开发板
    发表于 12-13 00:13

    基于HMM的语音识别系统是怎么训练

    基于HMM的语音识别系统是怎么训练的?有哪些步骤?
    发表于 12-23 06:16

    [CB5654智能语音开发板测评] 语音识别开发板的比较

    。另外,它还要求WIFI的设置与连接,否则也无法执行语音识别与应答。对于以上这两款开发板,如能较好地解决以上所述的问题,将增强用户的体验感及使用的方便性。驱动语音
    发表于 03-09 08:11

    【时擎科技AT1000开发板试用体验】初体验之开箱即用语音识别

    前言 本次拿到了时擎科技AT1000开发板,现在做一个简单的开箱体验。该开发板使用的是AT1000系列(AT16xx/18xx)端侧智能芯片AT1601。该芯片是一款高集成度、高能效比
    发表于 06-17 19:01

    新唐科技语音识别技术资料

    语音识别技术资料:新唐语音识别芯片、ISD9160_evb资料开发板原理图、ISD93xx_Se
    发表于 12-12 21:36 121次下载

    语音识别芯片LD3320开发手册

    语音识别芯片LD3320开发手册
    发表于 12-16 17:59 45次下载

    关于FPGA开发板和原型验证系统对比介绍

    其次,部分FPGA开发板也被用在IP和小型芯片设计的开发验证场景。这部分开发板配备大容量的FPGA芯片
    的头像 发表于 04-28 09:38 2683次阅读