0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

音频蓝牙语音芯片,WT2605C-32N实时录音上传技术方案介绍

WT-深圳唯创知音电子有限公司 2022-06-08 14:02 次阅读

基于WT2605C-32N音频蓝牙语音芯片的实时录音上传技术方案介绍

现代社会,信息技术的发展尤其迅速,信息和数据的重要性和安全性日渐深刻,在某些特殊场合,因为工作上的需要,或者日常生活的需求,往往需要记录和保留一些重要的声音。在某些时刻,录音成为记录生活,保存证据的重要手段,可见,录音技术对于我们现代生活尤为重要。

而随着录音技术的发展,一种实时录音技术受到更多人的青睐,相比较于传统录音而言,实时录音技术突破了设备的限制,从单纯的录音设备扩展到我们的云端,随时随地即可分享,实现了我们录音数据的可交互性,在实际应用中给提升了我们产品的应用价值,给用户带来更完美的体验感受。

唯创知音一直致力于成为语音物联网界的领导者,自主研发了一种实时录音技术上传技术,在录音笔,录音耳机等录音设备上面应用广泛,这种实时录音技术,具有数据量小,失真率低,降噪效果明显等特点,通过外部蓝牙设备,即可实现云端存储,云端即时播放等功能。不仅如此,这种录音上传技术因为其通用性强,广泛应用于唯创知音自主研发的各类蓝牙芯片上,下面我们以其中一种方案作简单的介绍:

WT2605C-32N录音上传方案介绍

1. 方案概述

录音上传技术近些年在录音笔,录音耳机中应用广泛,实现了移动录音设备和云端的互联,即时播放,即时翻译,同声传译成为产品一大亮点,极大方便了我们的生活。而要保证这些功能的实现,就离不开高品质的录音效果,和高压缩的录音数据,本方案录音采用IMA-ADPCM压缩算法。IMA-ADPCM (ADPCM Adaptive Differential Pulse Code Modulation), 是一种针对 16bit声音波形数据的一种有损压缩算法, 它将声音流中每次采的16bit 数据以 4bit 存储, 所以压缩比为1:4。而压缩/解压缩算法非常的简单, 所以是一种低空间消耗,高质量声音获得的好途径。

2. 方案框图

本方案采用WT2605C-32N芯片,可外挂本地存储设备,通过串口与蓝牙透传芯片进行通信,将录音数据上发给云端设备。

get?code=NDAwZjIwZjdlNDE4ZDAwYjg2ZjgwYzI0YTA3ZDYxM2UsMTY1NDY2NzQzNjYyMA==

3. 方案原理图

get?code=YzgxNzI3MmRlMWUyOTBjODk3YzhhZWZlNGRiZWZiZTEsMTY1NDY2NzQzNjYyMA==get?code=YThlNzhiZTExZGRmNjIxMDBiOGE4YzRjMmI3MWNlNTgsMTY1NDY2NzQzNjYyMQ==

4. 用户协议

4.1.协议命令格式

通讯数据格式是:起始位:1位;数据位:8位;奇偶位:无;停止位:1位。发送的指令都为十六进制的格式,默认波特率为115200,可进行修改,但不可小于115200波特率。使用电脑串口调试助手,需要正确设置串口的参数,设置如图:

get?code=ZmEwOGIzODU1OTA2ZjM3YWI1MjZhZjUyMzQwMWZiMWYsMTY1NDY2NzQzNjYyMQ==

注意:“长度”是指长度+命令码+参数+校验和的长度,“累加和校验”是指长度+命令码+参数的累加和的第八位。

4.2.返回码格式

get?code=NmEzOWIzOTgwMDA0YWY5NTgzZjdlYTA0YmFhZTNhZmQsMTY1NDY2NzQzNjYyMQ==

参数:00 :表示执行成功, 开始录音

01 :表示执行错误

02 : 表示文件不存在

4.3.命令列表

4.3.1. 录音开始命令(D6)

APP发送此条指令,控制录音芯片开始录音,此时录音芯片会返回开始录音成功返回码,录音过程中发送此条命令返回错误;

get?code=YWY4MGJiODYyMjY0N2M0OWE1MDRjMjc2MmIzYTNhZTEsMTY1NDY2NzQzNjYyMQ==

开始录音返回码:

get?code=NjM1NWI1NjJlM2MzNTIzNDIyYTNjNzlhZTYxZWE3ZTksMTY1NDY2NzQzNjYyMQ==

APP收到开始录音返回码,则开始准备处理接收到的录音数据,此时芯片进入录音状态,同时开始发送录音数据包。

首先录音芯片会发送一包60个字节的音频数据包,该包数据为IMA-ADPCM格式音频数据的音频头,前面包含“RIFF”标志和文件大小,注意此时ChunkSize 为0X00000034不包含当前音频数据包的长度,因此整个音频数据包的头长度为0X08+0X34,也就是60个字节的长度。客户需要录音结束并接收完整个数据包之后,重写这个位置。

例如,当前文件的音频头标识如下:

get?code=ZDM1OTJmNjNmNDU1ZTdhM2ZmOThkN2FjNTRjMGE1NGYsMTY1NDY2NzQzNjYyMQ==

接下来的音频头包含Format Chunk 块和Fact Chunk,客户不用关心实际数据情况。

get?code=NTQ1ZjE4NzRmNWJiN2QwNTNlZmJhYjc0NzNlZWEwZGYsMTY1NDY2NzQzNjYyMQ==get?code=ZWYwZDA5ZDJhYjliNjFkMjY0MzNkMzk1MWExNmY4ZGQsMTY1NDY2NzQzNjYyMQ==get?code=M2E3NDVkZjNlYjgwZjFjYTVjMGRhYzI4MmE4MzVlZjksMTY1NDY2NzQzNjYyMQ==

最后的音频数据头包含Data Chunk 客户需要录音结束并接收完整个数据包之后,重写DataChunkSize这个位置

get?code=ZDhkMzFjOGM5ODY0MGM4NDI2ZDA2NDZlZjA2NTYxZGEsMTY1NDY2NzQzNjYyMQ==get?code=ZWQ5NTliOTVkYjMyMDRjYTdmMTdlZGQ0NDE3ZDVjYWIsMTY1NDY2NzQzNjYyMQ==

音频数据头发送完毕后,紧接着会发送音频数据包,按照目前设置,每个数据包C长度为256个字节,受限于每个手机蓝牙MTU限制,每包数据量不能超过手机默认的MTU值,所以这里按照最小MTU值128字节进行配置,将数据包C分两包A+B数据包发送,A和B每包数据量为128字节, 每包数据的间隔为10MS左右, 每个C包数据包间隔为60MS左右(根据录音码率决定,不可更改),即每一个C包数据包含整个nBlockAlign ,发送过程中即使某包数据丢失,也不会影响整个文件的播放。

get?code=NDY5YTVkMzJiZmU3NjUzZmZjNDA2NTYzN2UyNzQ1ZTYsMTY1NDY2NzQzNjYyMQ==get?code=NmM4NmM0NmEwZDllYWNkM2Y2ZTJhMzE3OTIyNjRkN2MsMTY1NDY2NzQzNjYyMQ==

当客户开始接收音频数据包的时候,客户APP需要记录录音结束前总的音频数据包的个数,比如APP在结束录音时候共接收到0X36包音频数据包,则总的音频数据的长度为 0X36 * 0X100 = 0X3600;

4.3.2. 录音结束命令(DA)

APP发送此条指令,录音芯片接收到录音结束命令,停止发送录音数据包,并结束当前录音,返回结束录音返回码;

get?code=ZTdjMzBiZjhlNWU4YWVhMDI1OTlhODA3NzM5Yjk0Y2QsMTY1NDY2NzQzNjYyMQ==

结束录音返回码:

get?code=MzczMWMzMTNmMGM3OTM3NWNhNjJjZGZhZjFmZmQ2ZmYsMTY1NDY2NzQzNjYyMQ==

APP收到结束录音返回码,则保存当前录音文件,并将数据长度重写到文件相关位置,如图所示。至此,录音上传完成。

get?code=ZjI4NzRmYTcwNGIxMjVlZTZmMmMzMjJmZDUwMTZkMTcsMTY1NDY2NzQzNjYyMQ==

5. 程序设计框图

get?code=Njc3MzFhMWYzNzFiYmM3YjdkMTAyMTQ5OGM2ZjcxZjYsMTY1NDY2NzQzNjYyMQ==

6. 应用实例

下面我们用唯创WT-RS2 APP软件进行实际测试录音上传功能,首先打开APP,选择MP3方案;

get?code=YTZjZTYxYTUwM2I1MmNmMWRkZWIwYzQ2N2I0N2RjOTYsMTY1NDY2NzQzNjYyMQ==

连接蓝牙名称为VT-A782的蓝牙设备,连接成功后,APP界面默认会打印当前蓝牙设备的蓝牙MAC地址,唯创知音可以为每台蓝牙设备可以设置不同的的MAC地址,从而形成单独唯一的蓝牙名称,在某些应用场合,为每台产品形成唯一身份码。

get?code=NjlmYjVjOTRmYmJhYmI0OWM2Y2FmZTcyY2I5M2I0ZTQsMTY1NDY2NzQzNjYyMQ==get?code=NDBkNTEzMjViODMyZDQ2NDgyMDc3OWVkNTgzMDE4NjIsMTY1NDY2NzQzNjYyMQ==

点击APP界面开始录音标志,此时APP按照时间创建录音文件,此时开始接收录音数据,每个A和B包数据间隔10MS,每个C包数据间隔60MS,直到点击APP结束录音按钮,此时APP显示录音结束。此时录音文件已经创建完毕,客户可通过APP界面将录音文件通过分享的方式发送到电脑或者其他播放器进行播放!

关于我们

唯创知音作为一家专注于语音技术研究的高新技术企业,始终坚持以“服务好工程师”为目标,以行业语音交互器件标准化为方向,致力于让复杂变简单,提供快捷的语音、智能物联网应用解决方案。

WT588F02B、WT2003H系列语音芯片应用设计方案,在智能闹钟、智能水杯、雾化器等消费电子行业领域内已有成熟的应用案例。消费类电子产品应用是公司重要的发展领域,未来,唯创知音将在更多行业推出标准化语音芯片,进一步提升工程师的设计体验,为消费类电子行业标准化赋能。

更多详情可搜索:深圳唯创知音电子有限公司,与在线客服沟通,我们会发送一份选型表给到大家,芯片 与 模块 还可以申请免费送样服务,期待您的光临。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 蓝牙芯片
    +关注

    关注

    17

    文章

    376

    浏览量

    46066
收藏 人收藏

    评论

    相关推荐

    4G报警器WT2003H-16S低功耗语音芯片方案开发-实时音频上传

    的解决方案技术核心(1)音频上传实时音频上传:M
    的头像 发表于 12-31 17:52 81次阅读
    4G报警器<b class='flag-5'>WT</b>2003H-16S低功耗<b class='flag-5'>语音</b><b class='flag-5'>芯片</b><b class='flag-5'>方案</b>开发-<b class='flag-5'>实时</b><b class='flag-5'>音频</b><b class='flag-5'>上传</b>

    基于W2605C语音识别合成芯片的智能语音交互闹钟方案-AI对话享受智能生活

    随着科技的飞速发展,智能家居产品正逐步渗透到我们的日常生活中,其中智能闹钟作为时间管理的得力助手,也在不断进化。基于W2605C语音识别与语音合成芯片的智能
    的头像 发表于 12-31 11:54 42次阅读

    AI对话大模型全新解决方案,让好产品会说话-WT2605C芯片轻松赋能产品在线对话功能

    WT2605C芯片,作为一款集成了在线TTS(Text-To-Speech,文本到语音)功能的蓝牙语音
    的头像 发表于 12-12 15:17 162次阅读
    AI对话大模型全新解决<b class='flag-5'>方案</b>,让好产品会说话-<b class='flag-5'>WT2605C</b><b class='flag-5'>芯片</b>轻松赋能产品在线对话功能

    眼部按摩仪WT2605音频蓝牙语音芯片方案芯片实现语音提示及控制/手机无线音频传输功能

    WT2605音频蓝牙芯片方案因其高效、便捷、智能化等特点,成为了市场上的佼佼者。本文将详细介绍
    的头像 发表于 11-27 15:53 147次阅读

    蓝牙眼镜WT6900HA语音控制芯片方案:开启智能穿戴新篇章

    一款搭载WT6900HA语音控制芯片的智能蓝牙眼镜,在智能蓝牙眼镜中置入WT6900HA
    的头像 发表于 11-12 14:08 244次阅读
    <b class='flag-5'>蓝牙</b>眼镜<b class='flag-5'>WT</b>6900HA<b class='flag-5'>语音</b>控制<b class='flag-5'>芯片</b><b class='flag-5'>方案</b>:开启智能穿戴新篇章

    WT2605C TTS在线语音合成芯片:赋能多行业领域,引领产品智能化

    在当今科技日新月异的时代,语音技术正逐步渗透到我们生活的方方面面,而TTS(Text-To-Speech,文本到语音技术作为其中的重要一环,更是以其独特的魅力改变了人机交互的方式。
    的头像 发表于 09-12 15:54 333次阅读
    <b class='flag-5'>WT2605C</b> TTS在线<b class='flag-5'>语音</b>合成<b class='flag-5'>芯片</b>:赋能多行业领域,引领产品智能化

    唯创知音在线TTS方案简介及测试版操作说明

    在物联网与智能设备日新月异的今天,音频传输与控制技术成为了提升用户体验的关键环节。WT2605C蓝牙音频更新方案,凭借其强大的功能集与高效的
    的头像 发表于 08-30 13:20 218次阅读
    唯创知音在线TTS<b class='flag-5'>方案</b>简介及测试版操作说明

    WT2605C蓝牙语音芯片:引领糖尿病管理智能化,优化血糖仪音频蓝牙传输方案

    面临更高的糖尿病风险。 语音技术蓝牙技术在血糖仪中都发挥着巨大的作用,主要包括:语音蓝牙
    的头像 发表于 08-28 14:49 326次阅读
    <b class='flag-5'>WT2605C</b><b class='flag-5'>蓝牙</b><b class='flag-5'>语音</b><b class='flag-5'>芯片</b>:引领糖尿病管理智能化,优化血糖仪<b class='flag-5'>音频</b>与<b class='flag-5'>蓝牙</b>传输<b class='flag-5'>方案</b>

    「芯知识」低成本N8900 USB蓝牙模块语音播放芯片解决方案

    N8900蓝牙解码芯片集成了MP3、WAV硬解码和蓝牙5.0等功能,支持TF卡、Flash、U盘,方便电脑更新内容。音质优美,使用方便,稳定可靠,适用于自定义
    的头像 发表于 06-13 10:43 440次阅读
    「芯知识」低成本<b class='flag-5'>N</b>8900 USB<b class='flag-5'>蓝牙</b>模块<b class='flag-5'>语音</b>播放<b class='flag-5'>芯片</b>解决<b class='flag-5'>方案</b>

    WT2605芯片专为音频蓝牙应用而设计,是深一款高品质MP3语音编解码蓝牙芯片

    音频蓝牙
    WT-深圳唯创知音电子有限公司
    发布于 :2024年06月04日 17:16:23

    基于WT2605C语音芯片的电动车中控智能升级方案

    装置。中控安装在电动车内部,分别与电池、控制器、仪表、防盗装置及电动车组合开关相连接。在中控中添加WT2605C蓝牙芯片,用户只需通过手机即可实现数据监控、手机开锁、一键启动、防盗报警、一键下载更换报警声、用户交互感知和维护等功
    的头像 发表于 05-17 13:59 366次阅读
    基于<b class='flag-5'>WT2605C</b><b class='flag-5'>语音</b><b class='flag-5'>芯片</b>的电动车中控智能升级<b class='flag-5'>方案</b>

    体重秤蓝牙语音芯片方案-WT2605蓝牙音频ic在电子秤上的应用

    WT2605高品质MP3语音编解码蓝牙芯片,配合蓝牙BLE5.3芯片,可实现
    的头像 发表于 05-13 10:40 504次阅读

    AW30N蓝牙语音芯片

    杰理蓝牙BLE+语音一体化芯片AW30N系列,支持BLE、玩具类、小音箱类产品和通用MCU类应用二次开发。AW30N系列
    的头像 发表于 04-26 12:09 781次阅读

    基于WT2605C蓝牙语音芯片在车用蓝牙信息娱乐系统应用介绍

    随着汽车行业的不断更新变化,蓝牙语音芯片在汽车电子中的应用已经非常广泛,车用蓝牙信息娱乐系统,可与智能手机建立无缝连接,无需驾驶员手动操作,就能传输音乐,拨打电话,以及控制应用程序。
    的头像 发表于 03-19 10:09 1546次阅读
    基于<b class='flag-5'>WT2605C</b><b class='flag-5'>蓝牙</b><b class='flag-5'>语音</b><b class='flag-5'>芯片</b>在车用<b class='flag-5'>蓝牙</b>信息娱乐系统应用<b class='flag-5'>介绍</b>

    基于国民技术N32WB031的蓝牙语音遥控器解决方案

    N32WB031系列蓝牙芯片是国民技术新一代高性能、超低功耗的蓝牙5.1芯片,具有丰富的外设接口
    的头像 发表于 03-08 10:00 2117次阅读
    基于国民<b class='flag-5'>技术</b><b class='flag-5'>N</b>32WB031的<b class='flag-5'>蓝牙</b><b class='flag-5'>语音</b>遥控器解决<b class='flag-5'>方案</b>