0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于中文语音合成模块XF-S4240实现语音车载终端的设计

电子设计 来源:电子设计工程 作者:夏爱华,黄永强,刘 2021-03-31 16:34 次阅读

作者:夏爱华,黄永强,刘聪,张辉

1 引言

据广州市公布的《2005年广州市交通发展年度报告》统计,2005年广州市机动车拥有量为177.4万辆;据《法制晚报》报道2006年5月份北京机动车保有量可突破300万辆。奥运时将突破330万辆;而据2006年GSM协会公布的一组数据称:GSM手机用户数量超过20亿,中国市场最大。以上三组不同的数据显示:越来越多的人在驾驶着机动车并通过GSM终端与外界进行通讯。

现阶段,许多机动车辆都安装了车载终端。它主要用于车载导航、车辆调度、车载监控等。而许多终端设备是依靠手工操作显示终端来完成的,如驾驶员查看车辆调度中心或朋友发来的重要短消息。查看导航终端的地图等。这样就导致司机开车时不能专心,其直接后果可能导致严重的交通事故。

语音交流是人类最自然的交流方式,如果车载终端的很多操作可由实时的语音来代替的话,将有利于减少交通事故的发生率。例如,GSM Modem收到短消息,司机不用手动查看。语音合成系统可以自动播报出来;可以实时地提示司机行驶的方向与路名;可以实时地将交通状况播报出来。让驾驶员了解当前交通状况,通过了解道路交通拥堵的实时信息,从而避开拥堵路段,更快到达目的地等。语音合功能成的车载终端可提高车载终端的智能性、车辆驾驶的安全性和舒适性,使用户使用起来更加方便,更具有人性化。

2 语音合成及GSM M0dem

2.1 语音合成技术

语音合成技术是利用计算机、智能系统等设备,按预定的程序和指令,人为产生音素、音节、词和句子的技术。

目前,语音合成技术已发展到能实时地将任意文本转换成连续可懂的自然语句输出,相应技术通常称为文语合成或文语转换(Text To Speech,简称TTS),涉及到声学、语言学、语音数字信号处理技术、多媒体技术等多个学科。文语合成的原理:根据韵律建模的结果,从原始语音库中取出相应的语音基元,利用特定的语音合成技术对语音基元进行韵律特性的调整和修改,最终合成出符合实际的语音。

基于中文语音合成模块XF-S4240实现语音车载终端的设计

2.2 语音合成模块

本设计采用安徽中科大讯飞信息科技有限公司研发的一款高端中文语音合成模块XF-S4240。该模块可通过UART、SPI和12C三种接口接收待合成的文本,直接合成为语音输出(Line out)。

该模块采用。InterSound4.0 KT系统作为模块内核,一个是轻量级中文连续语音合成系统。

XF-S4240模块的特点如下:支持任意中文文本的合成。支持英文字母的合成,遇到英文单词时按字母方式发音;支持四种内码格式:GB2312(简体中文编码)、GBK(国家标准扩展编码)、Unicode(字符编码)、Big5(繁体中文编码);具有双发音人:男声、女声;具有智能的文本分析处理算法,可正确识别和处理数值、号码、时间日期及一些常用的度量衡符号,具备较强多音字处理和中文姓氏处理能力;支持软件调节语速、语调、音量等。 2.3 GSM Modem

GSM Modem是继GSM手机后又一种非常重要的GSM移动通信系统的终端设备。GSM Modem作为一种主要的GSM网络接入设备,它是传统调制解调器与GSM无线移动通信系统相结合的一种数据终端设备,因此也叫无线调制解调器。它的出现打开了GSM网络数据通信及其应用的大门。本设计采用西门子公司生产的第三代GSM双频ModemTC35i,该模块可广泛应用于POS终端、手持式设备、移动电脑、无线电话、交通控制和导航系统、快速管理安全系统、远程监视、远程抄表、自动售卖机等系统。

3 车载终端的硬件设计

系统硬件是以广州周立功单片机发展有限公司的ARM7系列Smart ARM2200嵌入式平台为基础。平台主控制器采用飞利浦公司生产的16/32位ARM7TDMI-S微控制器IPC2210,它具有丰富的外部接口,例如工业标准的UART、高速的I2C接口(400 kb/s)、SPI接口、A/D转换接口等,可以方便地与其他外设互连。

系统底层软件采用μCliunx内核,该内核是针对微控制领域而设计的Linux系统,适合无内存管理单元(MMU)的微控制器。

XF-S4240模块可通过UART、SPI和I2C接口实现与其他终端设备的通讯。本系统设计利用SmartARM2200嵌入式平台的I2C接口与XF-S4240的12C接口进行通讯。XF-S4240设置为从设备,默认地址为0x80,Smart ARM2200设置为主设备。GSM Modem则通过标准UART口与SmartARM2200嵌入式系统的通用串口2连接。

o4YBAGBvzU6AQZHMAABPMQL5c2Y248.png

4 软件设计

4.1 语音模块合成的通讯协议

无论XF-S4240采用UART、SPI还是I2C与其他智能系统连接,语音合成模块的上层通讯协议是相同的,下面将介绍语音合成的控制命令。

发送给XF-S4240的所有命令与数据均采用“帧”的方式进行数据封装后传输。

pIYBAGBvzWCAQxLDAAAgp_BoyG4239.png

其中,帧头长度为一个字节,定义为16进制“0xFD”;数据区长度占两个字节,高字节在前,低字节在后。数据区长度不定,但须小于1 024个字节。数据区包含命令字、命令参数和合成的语音信息。

o4YBAGBvzYWAII2CAABOzb519AU465.png

此帧的含义:0xFD表示帧头,0x00 0x0A表示数据区长度为10个字节。0x01表示语音合成命令,0x00表示文本格式为GB2312,剩余的16进制编码为中山大学的GB2312编码。

4.2 TC35i GSM Modem的通讯协议

TC35i GSM Modem与其他终端采用通用串行接口进行通讯,通讯协议采用AT指令集。本设计主要读取GSM Modem的短消息。而与短消息收发有关的规范主要包括GSM 03.38,GSM 03.40和GSM07.05。前两者重点描述的是SMS技术实现(编码方式),后者规定了SMS的DTE-DCE接口标准(AT命令集)。AT指令是以AT为开头,如AT+CMGL=0(GSM 07.05版本)表示读取最新收到的短消息,AT+CMGC表示发出一条短消息等。

短消息共有3种接收与发送模式:Block Mode(块模式),Text Mode(文本模式)和PDU Mode(PDU模式)。PDU模式最常用,支持所有手机,可以使用任何字符集。下面给出一个PDU模式下的ASCII串,其短消息中心号码(SMSC)是+8613800200500,发送者号码是13826468897.消息内容是“中山大学”,则通过读取它的“PDU串”是:“08 9l 68 3l 0820 00 05 F0 04 0D 91 68 31 28 46 86 98 F7 00 0860 30 02 11 82 21 80 08 D0 D6 BD C9 F3 B4 A7D1”。通过以上这个PDU串得知.要得到需要的用户信息就必须对“PDU串”进行解码。下面给出“PDU串”解码的数据结构。

4.3 应用程序的设计与流程

嵌入式平台SmartARM220的应用程序是运行于μCliunx内核之上,应用程序不能直接对硬件操作。为了实现硬件与外部设备通讯,必须调用相应的设备驱动程序。本文主要涉及UART驱动、I2C驱动,嵌入式驱动程序的设计方法在这里省略。

pIYBAGBvzZiAaks7AACxXqdod64253.png

5 结束语

基于语音合成技术和语音模块XF-S4240的车载终端可广泛应用于导航系统、车载调度、车载监控等。由于该技术的通用性,它还可应用于其他需要语音合成技术的场合,如排队叫号系统,公交报站器等。目前语音识别技术虽已取得很大的成绩,但效果不如语音合成技术,相信不久人们就可利用更加先进的语音技术自然地与机器进行交流!

责任编辑:gt

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 调制解调器
    +关注

    关注

    3

    文章

    841

    浏览量

    38727
  • 无线
    +关注

    关注

    31

    文章

    5412

    浏览量

    172919
  • 计算机
    +关注

    关注

    19

    文章

    7325

    浏览量

    87599
收藏 人收藏

    评论

    相关推荐

    车载导航人机语音交互系统的实现

    实现常规的手动交互方式,也可以实现语音交互方式。整个系统划分为三个子系统:导航子系统、语音识别子系统和语音
    发表于 08-15 21:27

    SYN6288语音合成芯片全开发

    经常搞各种语音芯片,发现SYN6288芯片合成功能很强大,功能很好用,于是趁星期六星期天的时间,搞了一下它的程序,发现这个片子很好用,它的功能如下:SYN6288 中文语音
    发表于 12-02 08:36

    语音合成芯片与语音芯片对比

    目前市面上的可发声芯片分为两大类:语音合成芯片与语音芯片。在实际开发语音终端产品工作中,有很多的研发人员在这两类芯片的认知上难免会出现概念上
    发表于 03-08 17:26

    语音合成芯片与语音芯片对比

    目前市面上的可发声芯片分为两大类:语音合成芯片与语音芯片。在实际开发语音终端产品工作中,有很多的研发人员在这两类芯片的认知上难免会出现概念上
    发表于 03-11 15:39

    车载导航人机语音交互系统的设计和实现

    实现语音交互方式。整个系统划分为三个子系统:导航子系统、语音识别子系统和语音合成子系统,各子系统间通过接口进行通信,协调完成
    发表于 05-07 07:00

    C51软件模拟实现SPI通信接口的方法

    开发中得到了验证。1 语音模块XF-S4240XF-S4240中文语音合成
    发表于 05-16 07:00

    语音合成IC与语音IC的两三事

    通讯方式,接收待合成的文本数据,实现文本到语音(或TTS语音)的转换。其特性是:支持任意中文文本的合成
    发表于 05-13 17:02

    语音合成IC选型之经验分享

    `语音合成芯片,又称TTS芯片,通过UART接口或SPI接口通讯方式,接收待合成的文本数据,实现文字转语音
    发表于 05-19 14:37

    中文语音合成芯片XFS3011电子资料

    概述:XF-S3011芯片是安徽中科大讯飞信息科技有限公司研发的一款中文语音合成芯片,将完整的语音合成
    发表于 04-21 07:02

    基于语音合成技术的车载终端系统该怎样去设计?

    什么是语音合成技术?基于语音合成技术的车载终端系统该怎样去设计?
    发表于 05-12 07:25

    XFS5152CE语音合成模块

    TTS是Text To Speech的缩写,即“从文本到语音”,是人机对话的一部分,让机器能够说话。语音播报功能的实现方式TTS语音模块,比
    发表于 08-12 08:14

    基于短信和语音合成的报警接口设计

    本文采用手机模块TC35i和语音合成模块XF-S3011构成短信和语音报警的智能接口,它在短信收
    发表于 07-29 16:17 38次下载

    基于DSP的中文语音合成系统设计

    基于DSP的中文语音合成系统设计 引言   本文介绍的就是一种基于DSP的中文语音合成系统
    发表于 10-09 14:50 1276次阅读
    基于DSP的<b class='flag-5'>中文</b><b class='flag-5'>语音</b><b class='flag-5'>合成</b>系统设计

    XF-S4240中文语音合成模块原理简介及分析

    XF-S4240 中文语音合成模块,是安徽中科大讯飞信息科技有限公司(科大讯飞)推出的基于科大讯飞在嵌入式
    发表于 05-25 09:56 4236次阅读

    TTS语音合成技术及其应用

    。 TTS语音合成技术已经广泛应用于各个领域,如语音助手、智能客服、车载导航等。在语音助手方面,TTS
    的头像 发表于 06-24 02:28 1156次阅读