优化lSD系列语音芯片的开发平台设计方案介绍-电子发烧友网

目前，市场上的语音芯片和语音板很多，从性能价格比上看，美国1SD 公司的ISD系列录放芯片可谓是一支独秀。1SD器件使用直接电平存储技术，省去了A／D、D／A转换；内部集成了大容量的EERPOM，不再需要扩展存储器；控制简单，控制管脚与TFL电平兼容。具有集成度高、音质好、使用方便等优点，是一种理想的语音处理芯片。

在控制上，除去手动外，lSD器件也可以通过地址寻址来精确定位，但它的地址不是字节地址单元，而是信息段的基本组成单位。以ISD2560为例，它内部的480kB的EEPROM均匀地规划为600行，每个地址单元指向其中一行，有600个地址单元。ISD2560的录放时间是60s，因此地址分辨率是100ms。lSD器件可进行多段地址操作，每一段称为一个信息段，它可以占用-行和多行存储空间。-个地址单元最多只能作为一个独立的段。因此，ISD2560最多可以分为600个信息段m。

2当前ISD芯片开发存在的问题

通常情况下，只能使用lSD器件提供的无需知道地址的操作模式，即手动模式，这只适合于开发语音玩具，而无法满足复杂操作或实时系统中应用的要求。为实现以上应用，最好使用对地址直接操作的办法。但在实用中，一些电路开发设计只是在基于语音信号已经写人芯片，并且段地址已经知道的基础上才能进行。然而，不可避免地要遇到必须将语音写入的时候。如果手动处理，采用按“录音”按键录音，“停止”按键停止，假如录音段数特别多，就要频繁地按上述按键，实在让人疲惫不堪。此外，手动按下“录音”及“停止”按键的时间也很难掌握，这就容易产生段间空白，造成芯片空间浪费，对语音段特别多，而语句又特别短的提示如一些单字、单词更是浪费严重。不仅这样，由于短句中空白时间过长，合成放音时出现语音不连贯。另外，直接对连接到1SD芯片的传声器录音会造成情绪紧张，容易出错，且无法对录入的语音进行高级处理。

3 解决方法

基于上述原因，需要设计一种lSD语音开发平台，借助传声器通过计算机的声卡将所有待写语音信号一并录入计算机，存储为*．wav文件，然后利用声音剪辑软件将各个词语（短句）分离出来。因为如果不是同时录音的话，对同一个人来说，其声音在不同时间、不同场合、不同情绪时都会有着很大的差别。如电子体重计，“您的体重是五十一公斤，您的身高是一百七十二厘米”，应该是由“您的、体重、身高、是、公斤、厘米、五、十、一、百、七、二”等12个词合成后形成的，如果由于某种原因，引起了任何一个词与其它语调不同，提示时就会显得特别突出，听起来有种怪怪的感觉。

若用计算机录音，可以一并录入很多段话（并非一定是全部需要的），然后从中选出所需词语（短句）。因为这些话是在较短的时间内完成的，所以不会有很大的语调变化，将从中选出的词组合起来时也不会显得牵强，听起来感觉不到这些句子是由词语拼凑起来的。

除此之外，如果有专业语音库，还可以直接从其中抽出词语来组成所需的句子，并且还省去了请专业录音人员的开支。这样还有一个好处是修改方便，因为当需要修改句子内容时，恰巧已经录过的句子中并没有这样的词语，则还必须请录音员重录一次，这不但增加了额外的开支，还由于时间过了较久，录音员的语调同原来相比肯定会有些变化，所以原来的录音只能全部作废，所有的一切都要从头开始。

综上所述，采用计算机来分析组合以及剪辑语音的好处是处理直观、修改方便，语句连续性强，合成的句子更具有人性化。

不仅如此，采用该开发平台，还可直观地看出每个语句的详细信息，包括：开始地址、结束地址、语句所用时间、语句所占用芯片行的段数等对使用该语音芯片时碰到的比较敏感的信息。

为此，设计整个开发平台的结构框图如图1所示。

优化lSD系列语音芯片的开发平台设计方案介绍

系统工作方式如下：首先，通过传声器将相关的大段语句经计算机声卡录制成为*，way文件并保存，然后借助于语音处理软件如CoolEdit剪辑出需要的单词（或短句）并去掉头尾的空白，将剪辑过的单词（或短句）每段都单独另存为新的·．wav文件，并把它们全部放人一个单独目录。启动1SD编程烧录器上位机开发软件，选中所有的待录*．wav文件，并点“开始烧录”，所有过程将会自动完成。烧录结束后会有提示，并且自动记录一份工作信息表，包括工作时间、语音文件数、录音总时间、每一段语音在lSD芯片中的起始地址及结束地址，其占用时间等。有了这些数据，就可以较方便地修改甚至对某些地方重新录制。将录制过的芯片及各段语音的起始地址表交给其它下位机程序员，他们就可以利用单片机或DSP等控制器来随心所欲地开发相应的语音提示设备了。

4 -F位机软硬件

下位机硬件应包括信号调理部分和数据通信部分，前者将信号电平调整到lSD芯片允许的最优的范围，后者接收计算机发来的各种控制信息，如“开始烧录”信号、“段间停止”信号、“返回结束地址”信号、“放音试音”信号，通过编程器的微控制器完成所需任务。

下位机硬件框图设计如图2。

优化lSD系列语音芯片的开发平台设计方案介绍

其中MAX232是电平转换芯片，它使计算机通过符合RS232协议的串口和符合TYL电平的单片机直接通信。准备录制时，电脑通过串口发出握手信号给单片机，单片机接到该信号作出响应，计算机接到该回答后将录音首地址发送给单片机，同时放音控件开始放音，信号由音频线输入到烧录器的信号接收端，经信号调整电路接至lSD芯片的录音管脚。单片机接到首地址后立刻发控制信息给1SD芯片，通知其开始录音。这样，就在上位机的协调下语音自动地烧录到了芯片。当该段语音录制完毕后，上位机发语音段结束信号，同时停止放音，单片机接收到该信号后，停止录音并读出结束地址，将其送回上位机。上位机读人该地址将其写入地址表以备查询。如果还有待录语音段的话，在上一语段的结束地址的基础上加1，作为新一段的开始地址，重复上述过程直至录音完毕。全部语音录制完毕后，上位机作出提示，让你选择放音按键，以测试录音效果。当按下该键时，上位机quot;依次放音“命令给单片机，单片机通知lSD芯片开始放音，ISD通过放音管脚将语音信号输出，经过功放芯片TDA2822M将功率放大后，通过扬声器发声，就可一段段地将刚录制的语音放出来。如有什么地方不满意，可通过地址表查出该段首地址，单独选择该段语音，将其首地址输入”起始地址“框，点击”开始录音“就可将该段语音重新录制一遍。

优化lSD系列语音芯片的开发平台设计方案介绍

5上位机软件

语音编辑软件采用CoolEdit，它包含高品质的数字效果组件，可在任何声卡上进行64轨混音。上位机运行环境用可视化的编程软件Visual C++6．0来开发。

上位机运行软件应有以下功能

（1）通信功能。因为上位机必须发控制信号以及起始地址数据给下位机，而下位机也要发应答信号及结束地址数据给上位机，故该通信为双向通信。在此采用MSComm控件。使用串口通信控件进行通信，必须首先对串口进行初始化。初始化后，就可以调用MSComm控件的SetOutput（）和Getlnput（）函数来对串口进行读写了，具体的使用方法在微软的开发手册

MSDN中有详细介绍。

（2）放音控制功能。上位机必须有放音控制功能，以便根据需要来开始、停止声卡放音。并且因为需要程序自动地控制，所以要求放音与停止放音能由VC命令语句来编程控制，在此采用CAc tiveMovie3控件。ActiveMovie不仅是一个播放器，同时也是ActiveX套件中的一个控件，它可以用来播放媒体文件，它支持绝大部分目前通用的媒体格式，它可以播放Wave，Midi，Avi，MPEG，QuickTime Movie等格式文件，甚至还可以用它来看视盘节目。由于它还是个控件，所以可以在VB或VC的程序中调用它。对它的操作相当简单，只需提供要播放的文件名就可以用Run，Pause，Stop方法来播放、暂停和停止该媒体文件。

（3）保存数据功能。需要将各种工作信息（尤其是起始地址信息）保存到一个文本文件，以供查询。保存数据比较简单，直接调用现有的函数即可。

6总结

文中针对当前使用lSD系列语音芯片中存在的问题，提出并设计了一种开发ISD系列芯片的平台，它可方便地对声音信号进行编辑处理，选好待录信号后可自动地将这些语音段录入1SD芯片，烧录过程中以直观形式显示进度，完毕后以文本文件的方式给出每个语音段的起始地址和结束地址，方便利用该芯片做相应的语音提示或其它电路，因此具有较大的实用意义。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

芯片

芯片

+关注

关注
455

文章
50816

浏览量
423647
存储器

存储器

+关注

关注
38

文章
7492

浏览量
163839
计算机

计算机

+关注

关注
19

文章
7494

浏览量
87959

NV512H语音芯片赋能加湿器方案，集语音播报+平台自定义语音功能

在秋冬季节，天气逐渐转凉，空气变得干燥，加湿器成为了许多家庭和办公场所不可或缺的电器设备。NV512H语音芯片赋能的加湿器方案，不仅提升了加湿器的智能化水平，更在用户体验上实现了质的飞跃

发表于 12-26 13:35 •76次阅读

NV512H<b class='flag-5'>语音</b><b class='flag-5'>芯片</b>赋能加湿器<b class='flag-5'>方案</b>，集<b class='flag-5'>语音</b>播报+<b class='flag-5'>平台</b>自定义<b class='flag-5'>语音</b>功能

Flash语音芯片相比OTP语音芯片的优势

Flash语音芯片和OTP语音芯片是两种常见的语音解决方案，在各自的应用领域中发挥着重要作用。本

发表于 12-16 16:02 •101次阅读

Flash<b class='flag-5'>语音</b><b class='flag-5'>芯片</b>相比OTP<b class='flag-5'>语音</b><b class='flag-5'>芯片</b>的优势

Flash语音芯片相比OTP语音芯片的优势

Flash语音芯片和OTP语音芯片是两种常见的语音解决方案，在各自的应用领域中发挥着重要作用。本

发表于 12-16 15:44 •112次阅读

NRK3502系列芯片 | 制氧机离线语音识别方案

NRK3502芯片制氧机离线语音识别方案制氧机离线语音识别方案是基于NRK3502蓝牙双模智能语音

发表于 12-04 01:02 •129次阅读

九芯语音合成芯片NVH-FLASH，看这一篇足矣！

平台可以直接在线生成播报语音，并支持一键烧录至芯片中，极大地简化了开发流程，缩短了产品上市周期。一、芯片

发表于 11-21 01:01 •186次阅读

离线语音识别芯片，让您的产品“听懂会说”

产品介绍NRK3502系列芯片是九芯电子新推出的一款蓝牙双模智能语音IoT芯片。芯片集成32位C

发表于 11-17 01:01 •204次阅读

WTN6040FP-14S语音芯片在电梯控制板中的应用开发方案-实现楼层指引背景音乐播放功能

环境，提高运行效率，本文将介绍一种基于WTN6040FP-14S语音芯片的电梯控制板开发方案。该方案

发表于 11-12 14:16 •182次阅读

NVH-FLASH语音芯片支持平台做语音—打造音频IC技术革新

与灵活的支持平台，正逐步引领着音频设备向更高品质、更智能化方向发展。一、NVH-FLASH系列语音芯片概述NVH-FLASH系列

发表于 10-16 08:02 •203次阅读

智能密码、指纹锁语音芯片ic方案可存放40s语音内容 NVD语音芯片

随着科技的飞速发展，智能家居安全领域迎来了前所未有的变革。智能密码与指纹锁作为现代家庭安全防护的重要一环，其背后的语音芯片IC开发更是这一变革中的关键技术突破。智能密码、指纹锁语音

发表于 09-25 08:01 •287次阅读

WTK6900芯片离线风扇语音控制方案，自适应降噪|精准识别，静享科技生活！

开发背景在这个智能家居时代，我们重新定义了“清凉”的含义。唯创知音作为智能语音识别领域的领航者，推出搭载WTK6900系列芯片的智能风扇解决方案

发表于 07-27 08:37 •361次阅读

深圳晶鑫微电子：引领智能语音芯片新纪元

智能语音IC开发，智能语音芯片方案

发表于 04-28 10:33 •402次阅读

电动车充电语音提示芯片-充电柜OTP语音方案开发

语音解决方案：otp智能语音升级方案开发

发表于 04-15 10:18 •537次阅读

语音IC-智能语音芯片方案-您身边的智选升级

语音IC方案开发-智能语音升级OTP开发应用场景

发表于 04-12 17:00 •498次阅读

基于唯创语音芯片的三大烟雾报警器语音方案

在智能设备与物联网(IoT)技术的飞速发展中，语音播报功能的重要性日益凸显，已成为提升用户体验、实现人机交互的关键一环。本文将深入探讨三种创新性语音播报系统设计方案：传统方案——独立的

发表于 04-12 15:08 •422次阅读

OTP语音芯片-语音IC智能升级方案

OTP语音方案开发

发表于 04-10 12:40 •494次阅读

搜索历史

优化lSD系列语音芯片的开发平台设计方案介绍

评论

NV512H语音芯片赋能加湿器方案，集语音播报+平台自定义语音功能

Flash语音芯片相比OTP语音芯片的优势

Flash语音芯片相比OTP语音芯片的优势

NRK3502系列芯片 | 制氧机离线语音识别方案

九芯语音合成芯片NVH-FLASH，看这一篇足矣！

离线语音识别芯片，让您的产品“听懂会说”

WTN6040FP-14S语音芯片在电梯控制板中的应用开发方案-实现楼层指引背景音乐播放功能

NVH-FLASH语音芯片支持平台做语音—打造音频IC技术革新

智能密码、指纹锁语音芯片ic方案可存放40s语音内容 NVD语音芯片

WTK6900芯片离线风扇语音控制方案，自适应降噪|精准识别，静享科技生活！

深圳晶鑫微电子：引领智能语音芯片新纪元

电动车充电语音提示芯片-充电柜OTP语音方案开发

语音IC-智能语音芯片方案-您身边的智选升级

基于唯创语音芯片的三大烟雾报警器语音方案

OTP语音芯片-语音IC智能升级方案