采用VC++和Matlab混合编程搭建基于HMM的语音识别的实验平台-电子发烧友网

1 引言

Matlab 是一款高性能的数值计算和可视化软件，集成数值分析、矩阵计算、信号运算、信号处理和图形显示于一体，构成了一个方便的、界面友好的用户环境。目前，基于Matlab 的语音识别开发平台虽然在可读性、可移植性和可扩充性上优于其它编程语言，且调试功能强大、数据库函数丰富，可使研究人员“站在巨人的肩上”更加直观、方便地进行分析、计算与设计工作，从而大大地节省了时间[1]。但考虑到其执行代码速度低下，不能直接与硬件底层直接接触等缺点，因此提出了采用Matlab 和VC++混合编程来搭建语音识别实验平台，并对传统Viterbi 算法进行变形，直接使用FPGA 的加法器、比较器和逻辑操作来计算观察值序列，以实现一种简单的嵌入式语音模板匹配。

2 基于HMM 的语音识别

2.1 语音识别系统

语音识别系统（Speech Recognition System，SRS）基本上是一个模式分类的任务，即通过训练，系统能够把输入的语音按一定模式进行分类[2]。实验在Matlab 7.0 系统上建立了一个简单的基于隐马尔可夫模型（Hidden Markov Model，HMM）的语音识别过程，如图1。

采用VC++和Matlab混合编程搭建基于HMM的语音识别的实验平台

（1）语音输入：在一般实验室环境下进行语音信号采样，采样格式为PCM，采样频率 16 KHZ，A/D 的量化精度8 Bit。然后经过去噪、预加重、分帧、加窗等处理过程，去掉语音信号中包含的大量冗余信息，加强语音信号的高频共振峰，便于进行频谱分析。

（2）端点检测：考虑到语音信号的录制是在较为安静的实验室环境下进行，利用过零率Z 来检测清音，用短时能量E 来检测浊音，两者配合实现可靠的端点检测[3]。

（3）特征提取和量化：对有效语音段进行特征提取，即提取基于Mel 刻度的倒频谱矢量（Mel Frequency Cepstrum Coefficients，MFCC），它是识别过程中的输入特征值。特征值经矢量量化Vector Quantization，VQ），输出VQ 码本类别号，即HMM 训练与识别阶段使用的观察值序列o。

（4）模型训练与语音识别：训练阶段，系统采用一系列训练观察值估计HMM 参数，

采用VC++和Matlab混合编程搭建基于HMM的语音识别的实验平台

2.2 Viterbi 算法

由于计算复杂度的限制，对于基于HMM 的实时语音识别来说，需要设计一个高效的硬件结构来执行Viterbi 译码过程，以加速HMM 的识别过程。考虑了FPGA 的特点，分别采用对数概率和状态概率的最小路径对传统的Viterbi 算法进行变形，其计算P( o |λ ) v 的过程如下[5]：

采用VC++和Matlab混合编程搭建基于HMM的语音识别的实验平台

通过上面的变形，不仅可以使传统 Viterbi 算法中的乘法转成加法，降低时间消化，有效地避免数据下溢的问题。而且随着Viterbi 计算过程的进行，已计算的状态概率值随之增加，改原来找结束概率的最大值为最小值[6]。因此，只需要计算T 时刻的概率T δ( i) ，它是大于前参考单词模型的最小值Pv 的。

实验将直接使用 FPGA 的加法器、比较器和逻辑操作来实现上述公式（2）和公式（3），可以显著提高系统效率，系统结构如下图2。

采用VC++和Matlab混合编程搭建基于HMM的语音识别的实验平台

在这一方案中，识别过程直接由 FPGA 芯片内的逻辑块从观察序列中计算概率得分，其中，观察值序列通过VQ 得出。系统包括了两个用来存储转移矩阵A 和输出概率矩阵B 的存储器，一个处理单元（Processing Element，PE）阵列，控制器，地址生成和附加比较逻辑。PE 包括有Viterbi 算法的核心模块加-比-选单元（Add-Compare-Select Unit，ACSU），状态累加器，和用来比较( i ) T δ 和极值Pv的附加比较器。PE 从HMM 参数寄存器中取出参考模型，沿最小路径计算其概率，然后与极值Pv 进行比较。当(i) T δ 大于Pv 时，控制器在下一状态时使PE 操作无效；同时，控制器控制存储器缓冲操作，并生成整个计算过程中的控制信号。

3 VC++和Matlab 混合编程

对于在 FPGA 上实现语音识别的核心模块——Viterbi 算法时，有许多工作需要在实验前完成，如定制硬件源代码、转换浮点数据为定点数据和电路仿真等。为减少这部分工作，采用软硬件协同设计的思想，由软件来执行HMM 模型训练和其它识别过程（如MFCC、 VQ 等）。在实验时，用软件来执行HMM 模型训练和语音单词识别。然后，把实验数据（语音数据和HMM 模型参数）转换成定点数据格式，由PCI 设备驱动程序将实验数据、源代码等下载到硬件，用于FPGA 验证平台。

根据上述思想，采用Matlab 和VC + +混合编制PCI 设备驱动程序，利用Matlab 系统提供的外部程序调用接口MEX 文件来实现其于VC++的混合编程。MEX 文件是一种约定格式编写的文件，使用C 语言或FOTRAN 语言编写，是由Matlab 解释器自动调用并执行的动态链接函数（Dynamic Link Library Function），它在Mac 下以.mex 为后缀名，在Windows 下即.dll 文件。基于C 语言的MEX 文件主要由两部分组成，第一部分称为入口子程序，其作用是在Matlab 系统与被调用的外部子程序间建立通信联系。第二部分称为计算功能子程序，它包含所有实际需要完成的功能的源代码，由入口子程序调用[7]。

采用VC++和Matlab混合编程搭建基于HMM的语音识别的实验平台

该方法可以在软硬件之间达到一致的识别结果，其方案描述如图3 所示。实验中，计算由FPGA 硬件完成，该子程序的主要负责FPGA 与PCI 的数据传递，即PCI 设备驱动。通过MEX 文件，不仅可在Matlab 系统中像调用内建函数一样调用存在的算法，使资源得到充分利用，避免重复程序设计。同时，还可以对硬件直接进行编程，弥补Matlab 的不足。

4 实验

该语音识别实验采用的硬件平台是包括有Altera Cyclone 系列EP1C12 的FPGA 和 PCI9054 芯片的PCI 开发板。EP1C 的FPGA 负责硬件Viterbi 计算，PCI9054 在驱动程序的帮助下负责PC 和FPGA 间实验数据和结果的传输。

由于 FPGA 的空间限制，实验选择了4 状态的HMM 模型和容量64 的VQ 码本，占用 FPGA 的LE（逻辑单元）1,125 个，存储单元占用约132K 位。然后将.sof 目标文件下载到 PCI 卡上的FPGA 芯片中运行，在Matlab 中调用VC++编写的PCI 设备驱动程序，将VQ 后的语音数据和HMM 模型参数传送给FPGA 内的Viterbi 译码电路，实验中，通过驱动程序输出模板标号与实际语音的标号及仿真实验导出的标号一致。

在 P4 3.0GHz 的PC 机和200MHz FPGA 验证平台上，对于约100 帧的单个语音文件识别而言，软/硬件Viterbi 算法的耗时如下表1 所示。

采用VC++和Matlab混合编程搭建基于HMM的语音识别的实验平台

由上述实验结果证明了该Viterbi 算法的VLSI 结构能够准确且快速地实现语音识别的解码过程，满足嵌入式计算精度要求，表明该实现方案是切实可行的。

5 结束语

采用 Matlab、VC + +和FPGA 搭建了一个软硬件协同的语音识别实验研究平台，以VC++来弥补Matlab 不能与硬件底层进行直接接触的不足。并在传统Viterbi 算法基础上，对其采取一定变形，直接使用FPGA 的加法器、比较器和逻辑操作建立Viterbi 算法的VLSI 结构，来计算观察值序列，以实现一种简单的基于HMM 语音识别的模板匹配。采用这种软硬件协同的实验研究平台，可在利用前面Matlab 的实验成果基础上，逐步实现语音识别各功能模块的嵌入式设计，减少工作量，并易于调试。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

FPGA

FPGA

+关注

关注
1625

文章
21620

浏览量
601174
matlab

matlab

+关注

关注
181

文章
2960

浏览量
230010
语音识别

语音识别

+关注

关注
38

文章
1710

浏览量
112484

VC与MATLAB混合编程在语音及图像处理中的应用

VC与MATLAB混合编程在语音及图像处理中的应用 [hide][/hide]

发表于 11-25 09:28

VC和MATLAB混合编程绘制三维图形设计

VC和MATLAB混合编程绘制三维图形设计

发表于 11-26 10:41

【PDF】VC与Matlab混合编程的研究与实现

【PDF】VC与Matlab混合编程的研究与实现附件下载：

发表于 02-26 11:33

转：基于vc和matlab混合编码的语音信号处理

基于vc和matlab混合编码的语音信号处理

发表于 07-21 14:07

MATLAB 与VC混合编程问题，MATCOM

我在用MATLAB和VC混合编程，想要用matcom控件将m函数文件转换为c++代码，但是在matcom里编写好了m函数后编译时出现以下错误： d:/matlab7/toolbox/

发表于 06-16 14:43

Matlab与VC混合编程

Matlab与VC混合编程

发表于 04-03 16:14

Matlab与C/C++ 混合编程技术总结的太棒了

在工程实践中，用户经常遇到Matlab 与C/C++混合编程的问题。本文基于Matlab 6.5和VC6.0 开发环境，在Windows 平台

发表于 04-26 06:42

求一种基于VB和VC++混合编程的EMI标准自动测试系统软件设计

求一种基于VB和VC++混合编程的EMI标准自动测试系统软件设计

发表于 04-27 06:37

VC++和Matlab混合编程的语音识别研究

采用VC++和Matlab 混合编程搭建了一个高效的基于HMM 的

发表于 12-07 14:00 •44次下载

Matlab和VC混合编程的DSP数据采集系统

设计了基于Matlab 和VC 混合编程的DSP 数据采集系统，实现了在Matlab 平台上控制和操作DSP 目标板进行数据采集，并把采集的

发表于 01-25 14:43 •50次下载

基于MATCOM的MATLAB与VC混合编程技术研究

研究了基于MATCOM的MATLAB与VC混合编程技术，提出了一种简便的设置MATCOM环境的方法，介绍了MATCOM提供的一个方便调试工具——矩阵查看器及其具体使用方法。结合实例，详细介绍了基

发表于 07-05 16:43 •18次下载

Matlab和VC++混合编程实现障碍检测系统

文中主要研究移动机器人在环境未知情况下的障碍物检测问题，提出了一种基于Matlab和VC++混合编程的障碍物检测系统软件实现方法。该方法整合了MATLAB的数值计算功能，具有强大的

发表于 09-05 13:45 •2394次阅读

Qt与Matlab混合编程

Qt与Matlab混合编程

发表于 03-27 08:48 •0次下载

基于Matlab和VC混合编程的DSP数据采集系统

基于Matlab和VC混合编程的DSP数据采集系统

发表于 10-20 09:31 •4次下载

matlab vsFortran混合编程工具

matlab vsFortran混合编程工具

发表于 06-30 14:51 •0次下载

搜索历史

采用VC++和Matlab混合编程搭建基于HMM的语音识别的实验平台

评论

VC与MATLAB混合编程在语音及图像处理中的应用

VC和MATLAB混合编程绘制三维图形设计

【PDF】VC与Matlab混合编程的研究与实现

转：基于vc和matlab混合编码的语音信号处理

MATLAB 与VC混合编程问题，MATCOM

Matlab与VC混合编程

Matlab与C/C++ 混合编程技术总结的太棒了

求一种基于VB和VC++混合编程的EMI标准自动测试系统软件设计

VC++和Matlab混合编程的语音识别研究

Matlab和VC混合编程的DSP数据采集系统

基于MATCOM的MATLAB与VC混合编程技术研究

Matlab和VC++混合编程实现障碍检测系统

Qt与Matlab混合编程

基于Matlab和VC混合编程的DSP数据采集系统

matlab vsFortran混合编程工具