0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云打印机基于唯创知音语音播报+TTS(语音合成)+离在线识别技术的五大语音方案

WT-深圳唯创知音电子有限公司 2024-12-31 17:34 次阅读

AUTUMN前言

当下打印机使用越来越广泛,品种也日益增多,从企业到商家到用户,不同的客户群体都有不同的需求。就拿语音播报来说,早先的打印机只做简单的文本打印功能,不带语音播报提示,后来逐步加上语音提示,如开机音效:欢迎使用xx品牌、提示语打印机缺纸等,及随着网络的发展,加入4G或WIFI的功能,通过TTS技术,进行实时文本播报。

本文则对打印机引入在线TTS+AI对话方案及唯创其他语音方案做了综合介绍。

AUTUMN方案介绍

以下将介绍唯创语音IC在打印机行业的方案运用:

01方案一

普通语音播报系列打印机,WTN6/WT588F02B型号,语音提前放到芯片内置空间,指令控制播报提示。应用框图如下:

5d66a90c-c75a-11ef-9434-92fbcf53809c.png

方案优势:

性价比高,应用简单;可擦写版本,提供配套工具方便更新语音,快速调试

原理及技术特点:

唯创标准一线/二线控制协议,支持音量、播放、停止、循环模式指令设置

02方案二

普通语音播报系列打印机,WT2003H系列,支持挂载TF卡或者U盘播放,除提示音外,可存放更多音乐文件,支持MP3/WAV格式,支持USB连接电脑更换音频。应用框图如下:

5d760776-c75a-11ef-9434-92fbcf53809c.png

方案优势:

MP3音质效果,支持8-44.1KHz/8-320kbps音频码率播放,支持USB接口快速更换音频

原理及技术特点:

唯创标准UART串口控制协议,支持挂载SPI Flash、TF卡、U盘播放,支持音量、播放暂停、循环模式、插播等指令设置

03方案三

支持语音更新系列打印机,WT3000A,BLE透传更新本地音频及自定义音效,无需接线,配合手机app或微信小程序,无线更新音频到WT3000A外置存储中。APP SDK可打包外发,嵌入到用户APP中或开发微信小程序应用。应用框图如下:

5d88cce4-c75a-11ef-9434-92fbcf53809c.png

方案优势:

· 解决多语种需求,设备本地无需预存多国音频,减少了本地储存成本,解决本地音频更换难,文本合成音频繁等问题

· 支持语种:全球 16 个语种,包括中文、英文、中英混合、法语、泰语、意大利语、韩语、日语、印尼语、德语、西班牙语、俄语、越南语、马来语、菲律宾语;同时还支持 6 个国内方言,即粤语、东北话、天津话、台湾话、四川话、湖南话

原理及技术特点:

· 音频格式:MP3,8-44KHz,8-320Kbps,上传后APP端都会压缩16KHz/18Kbps单声道MP3音频下发到本地;

· 传输速率:10KByte/秒左右;

· TTS合成:支持16 国语种 6 种国内方言,可配置选择,支持文本+背景音乐合成;支持语速、语调、音量等参数调节;

· APP录音:限制时长1分钟,录完点击设备写入,自动下发;

· 本地音频上传:数量无限制,取决于外置SPI Flash容量,最大可外挂128Mbit;

· APP开发:SDK可打包外发,可定制开发;

· 微信小程序开发:支持定制;

· 工具包:说明书、硬件资料、操作视频、测试工具。

04方案四

支持离线文本合成播报打印机,针对带WIFI类打印机,打印时可根据打印状态,实时提示播报,语音内容无需再固化内置,WT3000T离线TTS系列配合客户MCU即可实现该功能。应用框图如下:

5d98b80c-c75a-11ef-9434-92fbcf53809c.png

05方案五

支持离在线文本合成播报打印机,针对带WIFI类打印机,或者不带WIFI打印机,配套WT3000A M系列模组,上面自带WIFI+语音芯片,可实现文本合成超拟人的音色,还支持自定义添加背景音乐及效果,可带来生动有趣、富有感染力的听觉体验。应用框图如下:

5db325a2-c75a-11ef-9434-92fbcf53809c.png

方案四和五对比优势:

参数对比

传统离线TTS

离在线TTS

语种中文、中英文支持16国语种,6种国内方言
音质音色相对偏机械音色更丰富,支持超拟人音色
实时性MCU下发UART文本合成指令,离线速度相比在线更快点合成速度会存在1-2秒的延时,与WIFI网络稳定性及缓存有关
本地音频播放以WT3000T为例,除TTS合成文本播放外,A版本可内置30秒固定音播放,D版本可内置500秒固定音播放WT3000A本地本地音频播放,时长与挂载存储器容量有关,如32Mbit flash可内置16kbps的音频约34分钟
AI扩展不支持可引入AI对话,服务器部署产品知识库,在文本合成的基础上,增加产品的售前问答,趣味性对话等,更具个性化服务
开发调试工具配套样片/协议/Demo板,开发快提供服务器部署支持、手机app demo、测试板、样片/IC控制协议
项目成本优势唯创离线版TTS,同级别效果,价格有优势WT3000A离在线TTS方案对比市面上在线TTS方案,价格更具吸引力,可扩展定制自定义功能

离在线TTS原理及技术特点:

· 主要组成为MCU+语音IC、WIFI芯片+服务器这几大核心部分,分为上下位机来做描述:

-上位机主要由两部分组成,APP(配合Demo板操作演示)、服务器

· APP:一键蓝牙配网,文本合成下发,设置语种、音色、音调、音量;

· 服务器:文本音频合成下发、可接入AI大模型对话;

-下位机:主要由三部分组成,MCU、WT3000A+功放、WIFI芯片

· MCU:客户自有主控部分,驱动外设(实现本身产品的功能、交互)、通过UART接口下发文本信息(文本格式支持GB2312、UTF-8等格式)、控制本地音频播放、发起配网请求等;

· WT3000A+功放:与MCU/WIFI模组通讯、解码播放;

· WIFI芯片:联网、音频数据传输,当前传输采用MQTT协议,本司私有协议,建立订阅后,根据不同的主题,发布相关内容,详情请参考本司相关资料。

AUTUMN总结

基于打印机方案,唯创可提供多种语音播报类方案,如简单语音播报、语音更新方案(USB/UART/蓝牙更新....)、离在线TTS方案等。如需要IC样品或Demo板测试体验,及更多技术交流,可联系本司业务人员,或官网留言,欢迎交流分享!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音合成
    +关注

    关注

    2

    文章

    90

    浏览量

    16169
  • 语音播报
    +关注

    关注

    1

    文章

    28

    浏览量

    14546
  • TTS
    TTS
    +关注

    关注

    0

    文章

    42

    浏览量

    10800
  • 语音方案
    +关注

    关注

    1

    文章

    14

    浏览量

    2703
收藏 人收藏

    评论

    相关推荐

    ASR语音识别技术应用

    ASR(Automatic Speech Recognition)语音识别技术,是计算机科学与人工智能领域的重要突破,能将人类语音转换为文本,广泛应用于智能家居、医疗、交通等多个领域。
    的头像 发表于 11-18 15:12 712次阅读

    语音提示器-WT3000A在线TTS方案-打破语种限制/AI对话多功能支持

    TTS(Text To Speech )技术作为智能语音领域的重要组成部分,能够将文本信息转化为逼真的语音输出,为各类硬件设备提供便捷的语音
    的头像 发表于 10-25 10:36 251次阅读
    <b class='flag-5'>语音</b>提示器-WT3000A<b class='flag-5'>离</b><b class='flag-5'>在线</b><b class='flag-5'>TTS</b><b class='flag-5'>方案</b>-打破语种限制/AI对话多功能支持

    贺卡相传温馨有情—— 语音芯片为您的产品传递心声

    俗话说‘礼轻情意重’,贺卡、礼品为你、我、他之前构建了情感传递的桥梁,一份礼物,一份心意,初心不变,贺卡相传,知音语音芯片产品给您及您的家人、朋友带去感动与美好。 市场上有诸
    的头像 发表于 10-25 10:34 245次阅读
    贺卡相传温馨有情—— <b class='flag-5'>唯</b><b class='flag-5'>创</b><b class='flag-5'>语音</b>芯片为您的产品传递心声

    语音提示器-WT3000A在线TTS方案-打破语种限制/AI对话多功能支持

    前言forewordTTS(TextToSpeech)技术作为智能语音领域的重要组成部分,能够将文本信息转化为逼真的语音输出,为各类硬件设备提供便捷的语音提示服务。本
    的头像 发表于 10-25 08:11 248次阅读
    <b class='flag-5'>语音</b>提示器-WT3000A<b class='flag-5'>离</b><b class='flag-5'>在线</b><b class='flag-5'>TTS</b><b class='flag-5'>方案</b>-打破语种限制/AI对话多功能支持

    贺卡相传温馨有情-知音芯片为您传递心声

    概述俗话说‘礼轻情意重’,贺卡、礼品为你、我、他之前构建了情感传递的桥梁,一份礼物,一份心意,初心不变,贺卡相传,知音语音芯片产品给您及您的家人、朋友带去感动与美好。市场上有诸多贺
    的头像 发表于 10-24 08:09 233次阅读
    贺卡相传温馨有情-<b class='flag-5'>唯</b><b class='flag-5'>创</b><b class='flag-5'>知音</b>芯片为您传递心声

    知音WT2605C用在在线语音识别方案# #语音芯片 #语音识别 #知音

    语音识别
    WT-深圳唯创知音电子有限公司
    发布于 :2024年09月12日 17:24:28

    WT2605C TTS在线语音合成芯片:赋能多行业领域,引领产品智能化

    作为一款集成了在线TTS功能的蓝牙语音芯片,凭借其卓越的性能和广泛的应用领域,正引领着智能语音技术的新风尚。
    的头像 发表于 09-12 15:54 333次阅读
    WT2605C <b class='flag-5'>TTS</b><b class='flag-5'>在线</b><b class='flag-5'>语音</b><b class='flag-5'>合成</b>芯片:赋能多行业领域,引领产品智能化

    收款机TTS语音芯片新方案:WT3000T8,双语合成流畅,字库解码多样!

    一:方案背景概述随着科技的飞速发展,人工智能和语音识别技术在各个领域都得到了广泛应用。其中,文本转语音
    的头像 发表于 07-27 08:38 669次阅读
    收款机<b class='flag-5'>TTS</b><b class='flag-5'>语音</b>芯片新<b class='flag-5'>方案</b>:WT3000T8,双语<b class='flag-5'>合成</b>流畅,字库解码多样!

    什么是离线语音识别芯片?与在线语音识别的区别

    离线语音识别芯片适用于智能家电等,特点为小词汇量、低成本、安全性高、响应快,无需联网。在线语音识别功能更广泛、
    的头像 发表于 07-22 11:33 415次阅读

    收款机TTS语音芯片新方案:WT3000T8,双语合成流畅,字库解码多样!

    TTS技术在收款机播报收银中具有重要的应用价值和发展前景。本方案采用WT3000T芯片增加语音功能。不但可用耳朵听
    的头像 发表于 06-26 11:17 672次阅读
    收款机<b class='flag-5'>TTS</b><b class='flag-5'>语音</b>芯片新<b class='flag-5'>方案</b>:WT3000T8,双语<b class='flag-5'>合成</b>流畅,字库解码多样!

    中英文语音合成芯片(TTS芯片)WT3000T8-在ETC上的应用案例

    随着智能化浪潮的推进,ETC(电子不停车收费)系统已逐渐成为现代交通的重要组成部分。在这一背景下,知音自主研发的WT3000T8中文转语音合成
    的头像 发表于 05-28 09:47 460次阅读

    WT3000T8-TTS语音合成芯片及应用场景介绍

    TTS语音合成芯片是一种能够将文本信息转化为自然语音的专用芯片。它通过内置的语音合成算法和音频处
    的头像 发表于 04-18 18:03 899次阅读

    基于语音芯片的三大烟雾报警器语音方案

    在智能设备与物联网(IoT)技术的飞速发展中,语音播报功能的重要性日益凸显,已成为提升用户体验、实现人机交互的关键一环。本文将深入探讨三种创新性语音
    的头像 发表于 04-12 15:08 432次阅读
    基于<b class='flag-5'>唯</b><b class='flag-5'>创</b><b class='flag-5'>语音</b>芯片的三大烟雾报警器<b class='flag-5'>语音</b><b class='flag-5'>方案</b>

    玩转语音合成芯片(TTS芯片),看这一篇就够了

    什么是语音合成芯片:语音合成芯片也称为TTS芯片,即文字转语音芯片,是一种能够将输入的文字信息转
    的头像 发表于 03-19 18:13 1431次阅读
    玩转<b class='flag-5'>语音</b><b class='flag-5'>合成</b>芯片(<b class='flag-5'>TTS</b>芯片),看这一篇就够了