什么是语音芯片?
语音芯片定义:将语音信号通过采样转化为数字,存储在IC的ROM中,再通过电路将ROM中的数字还原成语音信号。
根据语音芯片的输出方式分为两大类,一种是PWM输出方式,一种是DAC输出方式,PWM输出音量不可连续可调,不能接普通功放,目前市面上大多数语音芯片是PWM输出方式。另外一种是DAC经内部EQ放大,该语音芯片声音连续可调,可数字控制调节,可外接功放。
普通语音芯片放音功能实质上是一个DAC过程,而ADC过程资料是由电脑完成,其中包括对语音信号的采样、压缩、EQ等处理。
录音芯片包括ADC和DAC两个过程,都是由芯片本身完成的,包括语音数据的采集、分析、压缩、存储、播放等步骤。
ADC=Analog Digital Change 模数转换
DAC= Digital Analog Change 数模转换
音质的优劣取决于ADC和DAC位数的多少。例如:20秒到 340秒,最低从10秒到340秒。语音芯片直观的从名称上来看,就是与语音有关的芯片,语音就是存储的电子声音,凡是能发出声音的芯片,就是语音芯片,俗称声音芯片,英文准确些来说应该是Voice IC. 在语音芯片的大家庭中,根据声音的类型不同可分为(Speech IC)和(Music IC)两种。这儿应该算是语音芯片专业的区分方法。
2、语音信号的量化表述:(分类:语音芯片 和 音乐芯片)
(a) “语音芯片”介绍:
(1)语音信号的量化
采样率(f)、位数(n)、波特率(T) 采样:将语音模拟信号转化成数字信号。 采样率:每秒采样的个数(byte)。
波特率:每秒钟采样的位数(bit)。波特率直接决定音质。Bps:bit per second
采样位数指在二进制条件下的位数。一般在没有特别说明的情况下,声音的采样位数指8位,由00H--FFH,静音定为80H。
(2)采样率
奈奎斯特抽样定理(Nyquist Law):要从抽样信号中无失真地恢复原信号,抽样频率应大于2倍信号最高频率。抽样频率小于2倍频谱最高频率时,信号的频谱有混叠。抽样频率大于2倍频谱最高频率时,信号的频谱无混叠。
嗓音的频带宽度为20~20K HZ左右,普通的声音大概在3KHZ以下。所以,一般CD取的音质为44.1K和16bit,如果碰到某些特别的声音,如乐器,音质也有用48K和24bit的情况,但不是主流。
一般在我们处理针对普通语音IC的时候,采样率最高达到16K就够了、说话声一般取8K(如电话音质)、6K左右。低于6K效果比较差。
在应用单片机的过程中,采样越高,定时器中断速度越快,会影响到其他信号的监控和检测,所以要综合考虑。
语音芯片有什么作用
语音芯片主要就是是产品上增加语音播报的功能,实现的也就是把语音播放出来。
常见的如:小家电按键语音、安全警报提醒、货车报“左转弯,请注意”等等,应用非常的广泛
语音芯片的种类,不过主要的分类基本也就大致两种:
1、第一种,称之为OTP语音芯片,大多数是SOP8封装的语音芯片,内置几段常用的语音,出厂之后就固化死了,不可修改,这个是通过专用的烧录器烧录进去的,也有可能是在制作晶元的时候就已经光照进去了,这种就需要很大的量了,所以运用不灵活,而且播放音质一般。
2、第二种,就是MP3语音芯片芯片,它是支持MP3解码,比OTP语音芯片在技术上是一个跨越,将MP3这种优秀的技术应用于语音芯片上,同时他强大的usb直接虚拟flash成为U盘,这样更新语音非常方便,直接像拷贝U盘一样拷贝语音进去就可以了。也可以通过外挂TF卡、SD卡或者U盘的方式进行解码播放,播放声音细腻优质。
语音芯片发展趋势
趋势一、定制化、低功效、高效能、端智能
语音芯片以其定制化、低功效、高效能、端智能以及成本上的优势等势必会在未来占据重要的市场地位,成为人与云端沟通的桥梁。在亚马逊、阿里、小米等公司的助推之下,智能音箱的销售在全球取得了爆发式的增长,语音芯片的出货量也将出现一个爆发。纵观这个语音芯片的发展历史,他经历了通用组合芯片、语音芯片、语音AI芯片三个阶段。而在起一个通用组合芯片阶段,由于芯片本身漫长的研发周期和高昂的研发投入,在当时并没有形成一定的市场规模的前提下,市场上并没有后出现专门运用了语音芯片的产品。另外一个方面,在语音交互场景出现的初期,智能设备并没有形成一定规模的销量,即使相关的从业者看到了潜在的机会,研发一款成熟的语音芯片所需要的前期的投入成本决定在初期的智能设备上不可能大规模使用语音芯片,只能以其他芯片作为过渡。
趋势二、AI语音芯片蓄势待发
未来,随着华为麒麟970芯片以及苹果A11芯片的推出,AI芯片成为行业热议的话题。所谓AI芯片也被称为AI加速器或计算卡,即专门用于处理人工智能应用中的大量计算任务的模块(其他非计算任务仍由CPU负责),从而实现端侧智能。
目前无论是智能音箱还是其他智能设备,更多的智能都是在云端来实现,但云端存在着语音交互“时延”的问题,对网络的需求限制了设备的使用空间,以及由此带来的数据与隐私危机。为了让设备使用场景不受局限,用户体验更好,端侧智能以成为一种趋势,语音AI芯片也随之而来。