0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

玩转语音合成芯片(TTS芯片),看这一篇就够了

智能语音 来源:智能语音 作者:智能语音 2024-03-19 18:13 次阅读

前言
什么是语音合成芯片:语音合成芯片也称为TTS芯片,即文字转语音芯片,是一种能够将输入的文字信息转换为语音输出的芯片。通过TTS芯片,我们可以将文字信息转化为自然语音,实现人机语音交互。
语音合成芯片的应用非常广泛。例如,在智能家居领域,它可以用于语音控制家电设备;在车载设备中,它可以实时播报导航信息或交通提醒;在医疗设备中,它可以帮助医生或患者获取语音形式的医疗信息;在机器人领域,它使得机器人能够与人类进行语音交互,提高人机交互的便捷性和自然性。

wKgZomX5OteAMkkyAACVX1ew54M478.png

一、芯片介绍
我们以市场中主流的TTS芯片SYN8086为例,它是一款性/价比更高,效果更自然的一款高端语音合成芯片。本芯片通过UART接口,接收待合成的文本数据,实现文本到语音(或TTS语音)的转换。
二、功能介绍
①、支持清晰、自然、准确的任意中文文本的合成,文本编码可采用GB2312、GBK、Unicode和UTF8四种编码方式。
②、芯片支持文本智能分析处理功能,对常见的数值、电话号码、时间日期、度量衡符号等格式的文本,芯片能够根据内置的文本匹配规则进行正确的识别和处理。
③、支持多音字和姓氏处理、多个发音人、音量、语速、语调调整、提示音等
④、支持低功耗模式、UART通讯方式。支持多种控制命令等
三、应用场景
- 车载终端 智慧停车 智能家居 智能闹钟
- 考勤终端 公交报站 智能手表 智能家电
- 排队叫号 预警终端 智能门铃 智能药盒
- 仪器仪表 智能玩具 智能门锁 智能穿戴
- 语音对讲 自助终端 血压计 充电桩

wKgZomX5O1GADNUPAAKOcoBgqfc777.png

四、最小系统
- 最小系统包括:控制器模块、语音合成芯片、功放模块和喇叭。
- 主控制器和语音合成芯片之间通过UART接口连接,主控芯片UART接口向语音合成芯片发送控制命令和文本,语音合成芯片把接收到的文本合成为语音信号输出,输出的信号经功率放大器进行放大后连接到喇叭进行播放。

wKgaomX5O4GAdapdAACtirs-b9M286.png

五、软件设计
1、串口命令
说明:上位机通过串口发送给语音合成芯片的所有命令和数据都需要用“帧”的方式进行封装后传输。
- 公共命令汇总

wKgZomX5PL2AWtwpAAE03pr5GqQ665.png

- 语音合成命令汇总

wKgaomX5PM6AAnIOAAClUV3kLhI091.png

举例:播放文本编码格式为 “GBK” 的文本“宇音天下”
命令帧:0xFD 0x00 0x0A 0x01 0x01 0xD3 0xEE 0xD2 0xF4 0xCC 0xEC 0xCF 0xC2

wKgaomX5POCAGgaAAAB3hx72uZU410.png

2、控制标记
说明:汉字博大精深的文化底蕴,和当前技术发展的限制,语音合成还不能做到百分之百的准确。为满足客户在各种复杂环境的个性化需求,特推出以下文本控制标记,用于灵活控制汉字发音的变化。

- 部分控制标记

wKgaomX5PPuATTvkAACBgHe4xCY797.png

wKgaomX5PQqAa8O9AAD2ERb06Co485.png

- 控制标记举例:

wKgaomX5PRqAQgahAABeWNKx8u0054.png

举例:设置TTS音量为10级
命令帧:0xFD 0x00 0x07 0x06 0x01 0x5B 0x76 0x31 0x30 0x5D
举例:设置TTS语速为10级
命令帧:0xFD 0x00 0x07 0x06 0x01 0x5B 0x73 0x31 0x30 0x5D

3、提示音
SYN8086语音合成芯片内集成了多首声音提示音,可用于不同行业不同场合的信息提醒、报警等功能。例如:刷卡音,门铃音,警报音等。
- 部分提示音举例

wKgaomX5PTyAVpCYAADT2eY7IB4248.png

举例:播放名称为“sound901”的提示音
命令帧:FD 00 0A 01 01 73 6F 75 6E 64 39 30 31

4、C语言范例

#include <  reg51.h  > #include <  string.h  > void main(void) { /需要发送的文本******************/ char code text[ ] = {"欢迎使用宇音天下研发的语音合成芯片"}; unsigned char headOfFrame[5]; unsigned char length ; unsigned int i = 0; length = strlen(text); //需要发送文本的长度 /串口的初始化********************/ TL1 = 0xFA; // 在11.0592MHz 下,设置波特率9600bps,工作方式2 TH1 = 0xFA; TMOD = 0x20; SCON = 0x50; // 串口工作方式1,允许接收 PCON = 0x80; EA = 0; REN = 1; TI = 0; //发送中断标志位置零 RI = 0; //接收中断标志位置零 TR1 = 1; //定时器1 用作波特率发生 /发送过程*********************/ headOfFrame[0] = 0xFD ; //构造帧头FD headOfFrame[1] = 0x00 ; //构造数据区长度的高字节 headOfFrame[2] = length + 2; //构造数据区长度的低字节 headOfFrame[3] = 0x01 ; //构造命令字:合成播放命令 headOfFrame[4] = 0x01 ; //构造命令参数:编码格式为GBK for(i = 0; i<  5; i++) //依次发送构造好的5个帧头字节 { SBUF = headOfFrame[i]; while (TI== 0) {;} //等待发送中断标志位置位 TI = 0; //发送中断标志位清零 } for(i = 0; i<  length; i++) //依次发送待合成的文本数据 { SBUF = text[i]; while (TI== 0) {;} TI = 0; } // while(1); }

六、硬件设计
1、通讯方式
语音合成芯片支持UART接口通讯方式,可通过UART 接口接收上位机发送的命令和数据。

wKgZomX5PvyAQ0TOAAAz4FJE3PI000.png

2、引脚定义

wKgZomX5Pw2AcgYNAAPw1PBBLZA511.png

3、参考电路

wKgaomX5P96AakEnAAIlYcZoups919.png

4、电源电路设计
3.1V-4.2V单独供电,接VCC口。POPEN、BAUD0、BAUD1、WAKEUP默认均有上拉电阻,如果IO需要上拉请上拉到VDDIO,而不是VCC。

- 功放参考电路

wKgZomX7pTeANy6VAAESqXMif7Y557.png

以CS8126T为参考

5、芯片参数
- 特性极限值

wKgaomX7p5uAeh_lAAB-jJH89ik981.png


- 电压工作范围

wKgaomX7p6uALOphAAA5nRrmrg8604.png


6、模块说明
- 模块实物图

wKgZomX7p7qAEH8MAAF_whG6BGU347.png

- 模块尺寸

wKgaomX7p8uABle2AACiaKiwV-Y110.png



- 模块引脚图

wKgaomX7p9aAIKmvAACss9n2HrI718.png

- 模块引脚定义

wKgaomX7p-GAGpwqAADLnsChdrA276.png

结语
智能语音技术正在引领人机交互进入全新的时代。其卓越的语音处理能力、高度集成化和小型化设计,以及不断优化的低功耗特性,使得语音合成芯片在智能家居、智能车载、可穿戴设备等多个领域展现出广阔的应用前景。
在此,我们期待语音合成芯片技术的不断创新与发展,为人与人、人与机器之间的沟通搭建起更加便捷、高效的桥梁,共同开启智能语音交互的新篇章。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • TTS
    TTS
    +关注

    关注

    0

    文章

    41

    浏览量

    10767
  • 语音合成芯片

    关注

    0

    文章

    17

    浏览量

    7488
收藏 人收藏

    评论

    相关推荐

    九芯语音合成芯片NVH-FLASH,看这一足矣!

    前言什么是语音合成芯片:简而言之,就是将文字信息转化为语音信号输出的电子器件。它能够将存储或接收到的文字内容,通过内部复杂的算法处理,转换成自然流畅的
    的头像 发表于 11-21 01:01 50次阅读
    九芯<b class='flag-5'>语音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>NVH-FLASH,看<b class='flag-5'>这一</b><b class='flag-5'>篇</b>足矣!

    九芯语音合成芯片NVH-FLASH,看这一足矣!

    NVH-FLASH系列语音芯片,支持多电压供电,低功耗,音频输出清晰,支持多种控制模式,广泛应用于智能终端设备,实现自然流畅的语音交互,缩短产品上市周期,成为理想选择。
    的头像 发表于 11-20 11:48 164次阅读
    九芯<b class='flag-5'>语音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>NVH-FLASH,看<b class='flag-5'>这一</b><b class='flag-5'>篇</b>足矣!

    语音提示器-WT3000A离在线TTS方案-打破语种限制/AI对话多功能支持

    TTS(Text To Speech )技术作为智能语音领域的重要组成部分,能够将文本信息转化为逼真的语音输出,为各类硬件设备提供便捷的语音提示服务。本方案正是基于唯创知音的离在线
    的头像 发表于 10-25 10:36 149次阅读
    <b class='flag-5'>语音</b>提示器-WT3000A离在线<b class='flag-5'>TTS</b>方案-打破语种限制/AI对话多功能支持

    WT2605C TTS在线语音合成芯片:赋能多行业领域,引领产品智能化

    作为款集成了在线TTS功能的蓝牙语音芯片,凭借其卓越的性能和广泛的应用领域,正引领着智能语音技术的新风尚。
    的头像 发表于 09-12 15:54 244次阅读
    WT2605C <b class='flag-5'>TTS</b>在线<b class='flag-5'>语音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>:赋能多行业领域,引领产品智能化

    收款机TTS语音芯片新方案:WT3000T8,双语合成流畅,字库解码多样!

    :方案背景概述随着科技的飞速发展,人工智能和语音识别技术在各个领域都得到了广泛应用。其中,文本转语音TTS)技术以其独特的优势,在收款机语音
    的头像 发表于 07-27 08:38 609次阅读
    收款机<b class='flag-5'>TTS</b><b class='flag-5'>语音</b><b class='flag-5'>芯片</b>新方案:WT3000T8,双语<b class='flag-5'>合成</b>流畅,字库解码多样!

    【算能RADXA微服务器试用体验】+ GPT语音与视觉交互:4,文字转语音

    文字转语音使用的技术简称为TTS般情况下我用的都是在线的EDGE-TTS服务。但非常幸运的是,BM1684X上居然有适配好的本地运行TTS
    发表于 07-15 23:18

    Jacob:从ElevenLabs解决的行业问题来看,AI创业的思路与互联网时代并不相同

    人声是最原始、最个性的表达方式之,为了提高效率,很多时候我们会使用合成语音来代替人声,涉及到的商业场景有很多,例如虚拟智能助理、客户呼叫中心、有声读物和媒体内容创作。文本转语音TTS
    的头像 发表于 07-10 08:05 232次阅读
    Jacob:从ElevenLabs解决的行业问题来看,AI创业的思路与互联网时代并不相同

    基于康养大模型和健康设备平台的智能蓝牙语音合成芯片VTX326

    AI健康监护智能体携手VTX326蓝牙TTS语音合成芯片,为健康管理插上了智慧的翅膀,从日常监测到个性化指导,每个环节都融入了科技的便利与
    的头像 发表于 07-03 11:33 322次阅读
    基于康养大模型和健康设备平台的智能蓝牙<b class='flag-5'>语音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>VTX326

    收款机TTS语音芯片新方案:WT3000T8,双语合成流畅,字库解码多样!

    TTS技术在收款机播报收银中具有重要的应用价值和发展前景。本方案采用WT3000T芯片增加语音功能。不但可用耳朵听语音播报收款的情况等(依用户需求设置),而且可以播放音乐或英语口语美文
    的头像 发表于 06-26 11:17 580次阅读
    收款机<b class='flag-5'>TTS</b><b class='flag-5'>语音</b><b class='flag-5'>芯片</b>新方案:WT3000T8,双语<b class='flag-5'>合成</b>流畅,字库解码多样!

    中英文语音合成芯片TTS芯片)WT3000T8-在ETC上的应用案例

    随着智能化浪潮的推进,ETC(电子不停车收费)系统已逐渐成为现代交通的重要组成部分。在这一背景下,唯创知音自主研发的WT3000T8中文转语音合成芯片
    的头像 发表于 05-28 09:47 391次阅读

    为什么说TTS语音合成芯片的广泛应用,低功耗才是关键

    引言 在智能硬件日益普及的今天,每点能量的节约都是科技进步的象征。尤其在语音合成芯片领域,如何在保证高性能输出的同时,实现能耗的最小化,是众多开发者不懈追求的目标。 今天,我们来揭秘
    的头像 发表于 05-21 10:03 504次阅读

    【解读】VTX316 TTS语音合成芯片几个很实用的应用技巧

      前言 VTX316是北京宇音天下科技有限公司最新推出的款更具性价比的中文TTS语音合成芯片,采用QFN32(4*4mm)封装,体积更加
    的头像 发表于 05-13 16:33 397次阅读

    20多年专注语音合成芯片公司分享:TTS芯片端是如何达到100%精准合成

    我国汉字文化博大精深,虽然现在语音合成技术发展较为成熟,但仍无法做到100%的智能分析和识别,来满足人们的需求习惯。 例如汉字“”,在不同语境下有3种读法,“一五一十”“路平安”“
    的头像 发表于 05-06 15:45 543次阅读

    WT3000T8-TTS语音合成芯片及应用场景介绍

    TTS语音合成芯片种能够将文本信息转化为自然语音的专用
    的头像 发表于 04-18 18:03 819次阅读

    亚马逊发布史上最大文本转语音模型BASE TTS

    亚马逊的人工智能研究团队近日宣布,他们成功开发出了迄今为止规模最大的文本转语音模型——BASE TTS。这款新模型拥有高达9.8亿个参数,不仅在规模上超越了之前的所有版本,还在能力上实现了质的飞跃。
    的头像 发表于 02-20 17:04 802次阅读