语音处理检测技术端点检测、降噪和压缩详解 - 全文

　　作为一种人机交互的手段，语音的端点检测在解放人类双手方面意义重大。同时，工作环境存在着各种各样的背景噪声，这些噪声会严重降低语音的质量从而影响语音应用的效果，比如会降低识别率。未经压缩的语音数据，网络交互应用中的网络流量偏大，从而降低语音应用的成功率。因此，音频的端点检测、降噪和音频压缩始终是终端语音处理关注的重点，目前仍是活跃的研究主题。

　　为了能和您一起了解端点检测和降噪的基本原理，带您一起一窥音频压缩的奥秘，科大讯飞资深研发工程师李洪亮将为我们详解语音处理检测技术中的热点——端点检测、降噪和压缩。

　　▎端点检测

　　首先来看端点检测（Voice Ac tivity Detection， VAD）。音频端点检测就是从连续的语音流中检测出有效的语音段。它包括两个方面，检测出有效语音的起始点即前端点，检测出有效语音的结束点即后端点。

　　在语音应用中进行语音的端点检测是很必要的，首先很简单的一点，就是在存储或传输语音的场景下，从连续的语音流中分离出有效语音，可以降低存储或传输的数据量。其次是在有些应用场景中，使用端点检测可以简化人机交互，比如在录音的场景中，语音后端点检测可以省略结束录音的操作。

　　语音处理检测技术端点检测、降噪和压缩详解

　　为了能更清楚说明端点检测的原理，先来分析一段音频。上图是一段只有两个字的简单音频，从图上可以很直观的看出，首尾的静音部分声波的振幅很小，而有效语音部分的振幅比较大，一个信号的振幅从直观上表示了信号能量的大小：静音部分能量值较小，有效语音部分的能量值较大。语音信号是一个以时间为自变量的一维连续函数，计算机处理的语音数据是语音信号按时间排序的采样值序列，这些采样值的大小同样表示了语音信号在采样点处的能量。

　　语音处理检测技术端点检测、降噪和压缩详解

　　采样值中有正值和负值，计算能量值时不需要考虑正负号，从这个意义上看，使用采样值的绝对值来表示能量值是自然而然的想法，由于绝对值符号在数学处理上不方便，所以采样点的能量值通常使用采样值的平方，一段包含N个采样点的语音的能量值可以定义为其中各采样值的平方和。

　　这样，一段语音的能量值既与其中的采样值大小有关，又与其中包含的采样点数量有关。为了考察语音能量值的变化，需要先将语音信号按照固定时长比如20毫秒进行分割，每个分割单元称为帧，每帧中包含数量相同的采样点，然后计算每帧语音的能量值。

　　如果音频前面部分连续M0帧的能量值低于一个事先指定的能量值阈值E0，接下来的连续M0帧能量值大于E0，则在语音能量值增大的地方就是语音的前端点。同样的，如果连续的若干帧语音能量值较大，随后的帧能量值变小，并且持续一定的时长，可以认为在能量值减小的地方即是语音的后端点。

　　现在的问题是，能量值阈值E0怎么取？M0又是多少？理想的静音能量值为0，故上面算法中的E0理想状态下取0。不幸的是，采集音频的场景中往往有一定强度的背景音，这种单纯的背景音当然算静音，但其能量值显然不为0，因此，实际采集到的音频其背景音通常有一定的基础能量值。

　　我们总是假设采集到的音频在起始处有一小段静音，长度一般为几百毫秒，这一小段静音是我们估计阈值E0的基础。对，总是假设音频起始处的一小段语音是静音，这一点假设非常重要！！！！在随后的降噪介绍中也要用到这一假设。在估计E0时，选取一定数量的帧比如前100帧语音数据（这些是“静音”），计算其平均能量值，然后加上一个经验值或乘以一个大于1的系数，由此得到E0。这个E0就是我们判断一帧语音是否是静音的基准，大于这个值就是有效语音，小于这个值就是静音。

　　至于M0，比较容易理解，其大小决定了端点检测的灵敏度，M0越小，端点检测的灵敏度越高，反之越低。语音应用的场景不同，端点检测的灵敏度也应该被设置为不同的值。例如，在声控遥控器的应用中，由于语音指令一般都是简单的控制指令，中间出现逗号或句号等较长停顿的可能性很小，所以提高端点检测的灵敏度是合理的，M0设置为较小值，对应的音频时长一般为200-400毫秒左右。在大段的语音听写应用中，由于中间会出现逗号或句号等较长时间的停顿，宜将端点检测的灵敏度降低，此时M0值设置为较大值，对应的音频时长一般为1500-3000毫秒。所以M0的值，也就是端点检测的灵敏度，在实际中应该做成可调整的，它的取值要根据语音应用的场景来选择。

　　以上只是语音端点检测的很简单的一般原理，实际应用中的算法远比上面讲的要复杂。作为一个应用较广的语音处理技术，音频端点检测仍然是一个较为活跃的研究方向。科大讯飞已经使用循环神经网络（Recurrent Neural Networks， RNN）技术来进行语音的端点检测，实际的效果可以关注讯飞的产品。

　　▎降噪

　　降噪又称噪声抑制（Noise Reduction），前文提到，实际采集到的音频通常会有一定强度的背景音，这些背景音一般是背景噪音，当背景噪音强度较大时，会对语音应用的效果产生明显的影响，比如语音识别率降低，端点检测灵敏度下降等，因此，在语音的前端处理中，进行噪声抑制是很有必要的。

　　噪声有很多种，既有频谱稳定的白噪声，又有不稳定的脉冲噪声和起伏噪声，在语音应用中，稳定的背景噪音最为常见，技术也最成熟，效果也最好。本课程只讨论稳定的白噪声，即总是假设背景噪声的频谱是稳定或者是准稳定的。

　　前面讲的语音端点检测是在时域上进行的，降噪的过程则是在频域上进行的，为此，我们先来简单介绍或者说复习一下用于时域-频域相互转换的重要工具——傅里叶变换。

　　为了更容易理解，先看高等数学中学过的傅里叶级数，高等数学理论指出，一个满足Dirichlet条件的周期为2T的函数f（t），可以展开成傅里叶级数：

　　语音处理检测技术端点检测、降噪和压缩详解

　　对于一般的连续时域信号f（t），设其定义域为［0，T］，对其进行奇延拓后，其傅里叶级数如下式：

　　语音处理检测技术端点检测、降噪和压缩详解

　　bn的计算同上，由上式可知，任何一个连续的时域信号f（t），都可以由一组三角函数线性叠加而成。或者说， f（t）都可以由一个三角函数线性组合组成的序列来无限的逼近。信号的傅里叶级数展示的是构成信号的频率以及各个频率处的振幅，因此，式子的右端又可以看做是信号f（t）的频谱，说的更直白一点，信号的频谱就是指这个信号有哪些频率成分，各个频率的振幅如何。上式从左到右的过程是一个求已知信号的频谱的过程，从右到左的过程是一个由信号的频谱重构该信号的过程。

　　虽然由信号的傅里叶级数很容易理解频谱的概念，但在实际中求取信号的频谱时，使用的是傅里叶级数的一种推广形式——傅里叶变换。

　　傅里叶变换是一个大的家族，在不同的应用领域，有不同的形式，在这里我们只给出两种形式——连续形式的傅里叶变换和离散傅里叶变换：

　　语音处理检测技术端点检测、降噪和压缩详解

　　其中的j是虚数单位，也就是j*j=-1，其对应的傅里叶逆变换分别为：

　　语音处理检测技术端点检测、降噪和压缩详解

　　在实际应用中，将数字采样信号进行傅里叶变换后，可以得到信号的频谱。频域上的处理完成后，可以使用傅里叶逆变换将信号由频域转换到时域中。对，傅里叶变换是一个可以完成由时域向频域转换的重要工具，一个信号经傅里叶变换后，可以得到信号的频谱。

　　以上是傅里叶变换的简单介绍，数学功底不太好的朋友看不大懂也没关系，只要明白，一个时域信号进行傅里叶变换后，可以得到这个信号的频谱，即完成如下转换：

　　语音处理检测技术端点检测、降噪和压缩详解

　　左面的是时域信号，右面的是对应的频谱，时域信号一般关注的是什么时间取什么值，频域信号关心的是频率分布和振幅。

　　有了以上的理论作为基础，理解降噪的原理就容易多了，噪音抑制的关键是提取出噪声的频谱，然后将含噪语音根据噪声的频谱做一个反向的补偿运算，从而得到降噪后的语音。这句话很重要，后面的内容都是围绕这句话展开的。

　　噪声抑制的一般流程如下图所示：

　　语音处理检测技术端点检测、降噪和压缩详解

　　同端点检测类似，假设音频起始处的一小段语音是背景音，这一假设非常重要，因为这一小段背景音也是背景噪声，是提取噪声频谱的基础。

　　降噪过程：首先将这一小段背景音进行分帧，并按照帧的先后顺序进行分组，每组的帧数可以为10或其他值，组的数量一般不少于5，随后对每组背景噪声数据帧使用傅里叶变换得到其频谱，再将各频谱求平均后得到背景噪声的频谱。

　　得到噪声的频谱后，降噪的过程就非常简单了，上图下面左侧的图中红色部分即为噪声的频谱，黑色的线为有效语音信号的频谱，两者共同构成含噪语音的频谱，用含噪语音的频谱减去噪音频谱后得到降噪后语音的频谱，再使用傅里叶逆变换转回到时域中，从而得到降噪后的语音数据。

　　下图展示了降噪的效果

　　语音处理检测技术端点检测、降噪和压缩详解

　　左右两幅图是降噪前后时域中的对比，左面的是含噪语音信号，从图中可以看到噪声还是很明显的。右侧的是降噪后的语音信号，可以看出，背景噪声被大大的抑制了。

　　下面两幅图是频域中的对比

　　语音处理检测技术端点检测、降噪和压缩详解

　　其中横轴表示时间轴，纵轴表示频率，左面的是含噪语音，其中的亮红色部分是有效语音，而那些像沙子一样的紫色的部分则是噪声。从图中可以看出，噪声不仅是“无时不在”，而且还是“无处不在”，也就是在各种频率处都有分布，右侧的是降噪后的语音，可以很明显的看出，降噪前那些像沙子一样的紫色的部分淡了很多，就是噪声被有效的抑制了。

　　在实际应用中，降噪使用的噪声频谱通常不是一成不变的，而是随着降噪过程的进行被持续修正的，即降噪的过程是自适应的。这样做的原因一方面是语音数据前部的静音长度有时不够长，背景噪声数据不足导致得到的噪声频谱往往不够准确，另一方面，背景噪声往往不是绝对稳定的，而是渐变的甚至会突变到另一种稳定的背景噪声。

　　这些原因都要求在降噪的过程中对使用的噪声频谱做及时修正，以得到较好的降噪效果。修正噪声频谱的方法是使用后继音频中的静音，重复噪声频谱提取算法，得到新的噪声频谱，并将之用于修正降噪所用的噪声频谱，所以降噪的过程中仍然要使用端点检测中用到的如何判断静音。噪声频谱修正的方法或者是新旧频谱进行加权平均，或者使用新的噪声频谱完全替换使用中的噪声频谱。

　　以上介绍的是降噪的非常简单的原理。实际应用中的降噪算法远比上面介绍的要复杂，现实中的噪声源多种多样，其产生的机理和特性也较为复杂，所以噪声抑制在现今仍然是一个较为活跃的研究领域，各种新技术也层出不穷，比如在实际应用中已经使用了多麦克风阵列来进行噪声抑制。

　　▎音频压缩

　　音频压缩的必要性众所周知，不再赘述。所有的音频压缩系统都要求有两种对应的算法，一种是运行于源端上的编码算法（encoding），另一种是运行于接收端或用户终端的解码算法（decoding）。

　　编码算法和解码算法表现出一定的不对称性。这种不对称性一是表现在编码算法和解码算法的效率可以不同。音频或视频数据在存储时，通常只被编码一次，但将被解码成千上万次，所以编码算法较复杂、效率降低、费用昂贵是可以被接受的，但解码算法一定要快速、简单而且廉价。编码算法和解码算法的不对称性还表现在编码和解码的过程通常是不可逆的，也就是说，解码后得到的数据和编码之前的原始数据可以是不同的，只要它们听起来或看起来是一样的即可，这种编解码算法通常称为有损的，与此对应的是，如果解码后得到和原始数据一致的数据，这种编码和解码称为无损的。

　　音视频编解码算法大多是有损的，因为忍受一些少量信息的丢失，往往可以换来压缩率的大幅提升，音频信号的压缩编码采用了数据编码中的一些技术，如熵编码、波形编码、参数编码、混合编码、感知编码等。

　　本次课重点介绍感知编码，相对于其他的编码算法，感知编码基于人耳听觉的一些特性（心理声学），去除音频信号中的冗余，从而达到音频压缩的目的。相对于其他的音频编码算法（无损的），在人耳没有感觉到明显失真的条件下，可以达到10倍以上的较大压缩率。

　　首先来介绍感知编码的心理声学基础。音频压缩的核心是去除冗余。所谓冗余就是语音信号中包含的不能为人耳所感知的信息，它对人类确定音色、音调等信息没有任何帮助，比如，人耳能听到的声音频率范围为20-20KHz，无法感知频率低于20Hz的次声波和频率高于20KHz的超声波。再比如，人耳也无法听到一段“不够响”的声音。感知编码就是利用了人类听觉系统的这类特性，达到去除音频冗余信息的目的。

　　感知编码中的心理声学主要有：频率屏蔽、时域屏蔽、可听度阈值等。

　　语音处理检测技术端点检测、降噪和压缩详解

　　频率屏蔽频率屏蔽在生活中处处可见，比如你在家中坐在沙发上安静的看电视，突然，正在装修的邻居家一阵很刺耳的电钻钻墙的声音传来，这时你所能听到的只有手提电钻发出的很强的噪声，尽管此时电视所发出的声音仍然在刺激着你的耳膜，但你却充耳不闻，也就是说，一段强度很高的声音可以完全屏蔽一段强度较低的声音，这种现象称为频率屏蔽。

　　语音处理检测技术端点检测、降噪和压缩详解

　　时域屏蔽承接前一个例子，不仅在电钻发出声音的时间内人耳听不到电视机的声音，就是在电钻的声音刚停下来的一小段时间内，人耳也听不到电视机的声音，这种现象称为时域屏蔽。产生时域屏蔽的原因是人类的听觉系统是一个增益可调的系统，听强度较大的声音时，增益较低，听强度较小的声音时，增益较高。有时人类甚至借助外部手段来改变听觉系统的增益，比如，捂耳朵以避免强度很大的声音损伤耳膜，而屏住呼吸、侧耳、以手放耳廓后更是听较弱声音时的常见行为。在上例中，强度很大的声音刚消失时，听觉系统需要一小段时间来调高增益，正是在这一小段时间内产生了时域屏蔽。

　　下面来说可听度阈值，它对于音频压缩灰常重要。

　　设想在一个安静的房间中，一台由计算机控制的扬声器可以发出某一频率的声音，刚开始时扬声器功率较小，处于一定距离上的听觉正常的人听不到扬声器发出的声音。然后开始逐渐增大扬声器的功率，当功率增大到刚好可以被听见的时候，记录下此时扬声器的功率（声强级，单位分贝），这个功率就是这个频率下的可听度阈值。

　　然后改变扬声器所发音频的频率，重复以上实验，最终获得的可听度阈值随频率变化的曲线如下图所示：

　　语音处理检测技术端点检测、降噪和压缩详解

　　由图中可以很明显的看出，人类的听觉系统对频率在1000-5000Hz范围的声音最敏感，频率越接近两侧，人类听觉反应越迟钝。

　　回过头来再看频率屏蔽的情形，这次实验在房间中增加一个频率为150Hz，强度为60dB的信号，然后重复实验，实验得出的可听度阈值曲线如下图所示：

　　语音处理检测技术端点检测、降噪和压缩详解

　　从图中很明显的看出，可听度阈值曲线在150Hz附近被强烈的扭曲了，被向上提高了很多。这意味着，本来位于可听度阈值之上的150Hz附近的某个频率的声音，有可能由于150Hz的更强的信号的存在而变得不可闻了，也就是被屏蔽了。

　　感知编码的基本规则就是，永远不需要对人耳听不到的信号进行编码，简单来说就是，听不到的信号不需要编码，这句废话恰恰是语音压缩研究的重点之一。废话的另外一种含义就是非常容易理解的正确的话。言归正传，哪些东西听不见呢？功率低于可听度阈值的信号或者说分量，被屏蔽的信号或者说分量，这些人耳都听不见，都是上文提到的“冗余”。

　　以上是心里声学的一些东西。要想很好的理解音频压缩，还需要理解一个更重要的概念：子带。子带（subband）是指这样的一种频率范围，当两个音调的频率位于一个子带内时，人就会把两个音调听成一个。更一般的情况是，如果一个复杂信号的频率分布位于一个子带内时，人耳的感觉是该信号等价于一个频率位于该子带中心频率处的简单信号，这是子带的核心内涵。简单说，子带是指一个频率范围，频谱位于这个范围内的信号可以用一个单一频率的分量来代替。

　　语音处理检测技术端点检测、降噪和压缩详解

　　一般等价的频率取子带的中心频率，振幅取子带内个频率分量振幅的加权和，更简单的方法则是将各频率分量的振幅直接相加，作为等价信号的振幅，这样一个范围内的频率分量用一个分量就可以代替了。

　　设一个信号的频谱频率最低值为w0，最大值为w1。子带编码就是将w0-w1之间的频率范围划分成若干子带，然后每个子带范围内的分量用一个等价的频率分量来替换。这样，一个具有复杂频谱的信号可以等价为一个频谱构成灰常简单的信号——频谱被大大简化了，需要存储的东西就非常少了。

　　从以上过程不难知道，子带如何划分对压缩后音频的质量影响很大（毕竟是近似等价）。子带的划分方法是子带编码的一个很重要的研究主题，大致可以分为等宽子带编码和变宽子带编码，见名知意，不解释。

　　子带划分后子带数量的不同导致了压缩算法的不同等级。容易知道，码率越低压缩率越高时，子带数量少，同时音质较差。相反的情况也容易理解。

　　理解了子带编码，音频压缩就很容易理解了，一个信号经过一组三角滤波器（等同于一组子带）后，被精简为数量很少的频率分量。然后考察这些频率分量，能量或者说振幅位于可听度阈值曲线之下的直接无视（删除该分量，因为听不到）。再考察余下的两两相邻的频率分量，如果其中一个被旁边的频率屏蔽，也删除掉。经过以上的处理，一个复杂信号的频谱所含有的频率分量就很简单了，使用很少的数据就可以存储或者传输这些信息。

　　解码的时候使用傅里叶逆变换将上面得到的简单频谱重构到时域上，得到解码后的语音。

　　以上就是音频压缩的简单原理，下面谈谈音频编解码库。

　　可以公开获取的音频编解码开源库很多，其特点和能力也有所不同，如下图：

　　语音处理检测技术端点检测、降噪和压缩详解

　　由图中可以看到，AAC和MP3等走的是“高端路线”，用来对高采样率的音乐进行编码，而AMR和SPEEX等走的是中低端路线，可以处理16K采样率以下的语音信号，这对于语音合成、语音识别、声纹识别等语音应用足够了。

　　科大讯飞语音云使用的是SPEEX系列，算法相关信息如下图所示：

　　语音处理检测技术端点检测、降噪和压缩详解

　　Speex编解码库压缩率变换范围较广，压缩等级可供选择的范围较宽，所以应用在网络状况较为复杂的移动终端应用中甚为合适。

　　好了，以上就是本次课分享的全部内容。

　　小结：

　　音频端点检测、降噪和语音压缩，很多人觉得神秘、难于理解和难以把握。但经李老师娓娓道来，平时感觉高大上的语音处理技术也被讲的深入浅出。原来，不需要很高深的理论功底也可以理解这些技术的关键：音频端点检测的关键是根据前面的静音确定用来分辨静音和有效语音的标尺，降噪的关键是使用前面的一小段背景噪音提取出噪声的频谱，音频压缩方法之一是充分利用人类的心里声学，划分子带，去除冗余等。

　　让我们一起关注语音处理技术在以上几个方面的最新发展吧。

　　演讲嘉宾介绍

　　李洪亮，毕业于中国科学技术大学。科大讯飞资深研发工程师，长期从事语音引擎和语音类云计算相关开发，科大讯飞语音云的缔造者之一，主导研发的用于讯飞语音云平台上的语音编解码库，日使用量超过二十亿。主导语音类国家标准体系的建设，主导、参与多个语音类国家标准的制定。他今天的分享将分为两大部分，第一部分是端点检测和降噪，第二部分是音频压缩。

阅读全文

上一页 1 2 3 4 5全文

本文导航

压缩(19252) 压缩(19252)
降噪(31166) 降噪(31166)
语音处理(19210) 语音处理(19210)
端点检测(6871) 端点检测(6871)

语音压缩算法研究

位机跑5M可以解码的算法。编码可以复杂一些。最也参考了很多国外关于语音压缩的算法，但是感觉好点的算法解码都相对比较复杂。欢迎广大工程师跟我一起探讨音频压缩方面的想法。有需要语音芯片的或者想跟我技术交流的请联系我QQ:1511156380或者直接在论坛交流也可以。

2013-09-18 17:38:38

BGA锡球焊点检测(BGA Solder Ball)

BGA 锡球焊点检测 (BGA Solder Ball)使用BGA 焊点检查机 (BGA Scope)，是采用45°棱镜的光学折射原理，从芯片侧边检查BGA焊点接面(Solder Joint)、锡球

2018-09-11 10:18:26

Firefly RK3399Pro开源主板 + 单目摄像头，人体特征点检测方案

随着“大数据”技术与高性能处理器的快速发展，机器视觉和深度神经网络技术得以深入研究，人体特征点检测率和准确度大大提高，可用于动作识别、人机交互、异常行为检测、人物跟踪等商业应用。方案简介人体特征点检测

2022-04-01 15:55:16

labview中角点检测的函数吗

labview中角点检测的函数吗

2017-05-24 09:52:35

《OpenCV3编程入门》角点检测之Shi-Tomasi角点检测

《OpenCV3编程入门》学习笔记10 角点检测(二）Shi-Tomasi角点检测

2020-05-25 14:58:13

【TL6748 DSP申请】玻璃纤维坯布的在线疵点检测系统性能优化设计

申请理由：审阅人，您好！我是西安工程大学电子信息学院控制理论与控制工程专业研究生，研究方向是机器视觉与图像处理，在研项目为玻璃纤维布的坯布疵点在线检测系统的优化设计。团队有多年研究疵点检测

2015-10-09 15:09:57

中断端点如何检测中断？

和BulkJin。我在主机上有一个C 2应用程序，用于发送和接收数据。将数据发送到测试系统是完美的。但我收到以下问题：中断端点：如何检测中断？在CYUSB .NET引用中没有示例…任何标志或例程，没有描述中断

2019-06-25 07:37:11

什么是压缩空气质量检测仪？

仪实在为一个压缩气体压力和流量调节装置，调节到检测管所要的压力和流量，其核心技术部件实际为检测管，属于安防领域中气体检测仪的衍生产品。目前使用最广的是Aerotest Alpha压缩空气质量检测仪[1]这款型号。

2019-09-10 10:42:03

做一个电线断线断点检测器原理是什么？

做一个电线断线断点检测器，原理是什么？

2021-03-17 06:51:48

分享一个屏幕坏点检测程序

这是我工作中测试一块LCM的程序，是检测一块LCM是否存在坏点，LCM是与CANBUS链接在一起测试的，不过也适用于其他的坏点检测

2014-10-11 22:44:10

基于FPGA的图像角点检测

有没有用verilog语言写的基于FPGA的图像角点检测代码呀？

2012-04-10 10:47:39

基于STM32嵌入式的孤立词语音识别系统设计

滤波、ADC、分帧、端点检测、预加重、加窗、特征提取、特征匹配。端点检测（VAD）采用短时幅度和短时过零率相结合。检测出有效语音后，根据人耳听觉感知特性，计算每帧语音的Mel频率倒谱系数（MFCC）。然后...

2021-08-06 08:32:00

基于matlab的图像处理--飞机检测

的MULTIFTR+MOTION、HOGLBP方法等。基于对各种检测方法的了解，本组采用了如下的检测方式：①读入图片②对图像进行预处理③将预处理后的图像进行二值化处理④对二值图的连通区域惊醒处理⑤对原图像及二值图进行角点检测⑥标记

2015-09-30 11:46:06

如何搭建基于SOPC的语音降噪系统？

2021-09-30 08:50:46

如何采用DSP内核技术进行语音压缩开发？

请问如何采用DSP内核技术进行语音压缩开发？

2021-04-21 06:59:56

对手腕PPG信号实施PRV分析的可靠峰值和起始点检测算法解析

本文提出了可对手腕PPG信号实施PRV分析的可靠峰值和起始点检测算法。

2021-06-17 09:25:04

微机灰熔点检测仪精度典范？

`微机灰熔点检测仪精度典范？微机灰熔点检测仪精度典范？【鹤壁市英特仪器仪表厂】详询138.3923.4904灰熔点化验设备，微机灰熔点检测仪，测试灰熔点的仪器，检测灰熔点的设备，电脑灰熔点化验设备

2019-11-22 19:21:13

微机燃点检测仪配置简要？

`微机燃点检测仪配置简要？微机燃点检测仪配置简要？【鹤壁市英特仪器仪表厂】详询138.3923.4904检测燃点的仪器，化验燃点的设备，生物燃料燃烧测定仪，煤炭燃点检测仪器，测试煤燃点的设备，全自动

2019-09-10 15:56:33

机器视觉图像处理之角点检测技术

角点是图像很重要的特征，对图像图形的理解和分析有很重要的作用。角点检测(Corner Detection)是计算机视觉系统中用来获得图像特征的一种方法，广泛应用于运动检测、图像匹配、视频跟踪、三维

2016-01-22 13:46:00

爆发点测定仪BFY-10型-发火点检测仪

`爆发点测定仪BFY-10型-发火点检测仪，爆发点测定仪BFY-10型-发火点检测仪由【鹤壁爆发点检测仪】提供的爆发点分析仪：186.3920.3323，爆发点检测仪，测试爆发点的仪器，智能发火点

2020-12-18 15:07:18

用AD5933做电导仪为什么检测液体电阻采用了多频多点检测？

请教各位老师：本人拟用AD5933做净水机在线电导仪，有几个问题求教各位老师：1、为什么AD5933检测液体电阻采用了多频多点检测，固定频率检测为什么不行？2、是用什么方法在多频多点检测的不同频率的多个数据中，整理出我们需要的正确的数据？谢谢各位不吝赐教。@

2018-09-19 10:26:51

用labview进行语音信号的端点检测

用labview进行语音信号的端点检测

2012-04-29 12:56:23

基于平均密度的孤立点检测研究

为了使孤立点检测更为自动化，减少用户对参数选择的困难，提出了平均密度的定义，并给出基于平均密度的孤立点检测方法。该方法提出了孤立点对象的密度要小于数据集的平

2009-01-01 00:01:08

基于图像距离差的织物疵点检测算法

本文将机器视觉与数字图像处理技术引入到织物疵点检测中，提出了一种织物疵点检测算法——图像距离差算法。该算法可使用户根据织物的类型，自行设置相应的疵点检测

2009-05-27 13:12:37

一种改进的检测语音端点的方法

在语音识别系统中产生错误识别的原因之一是端点检测有误差。针对短时过零率对噪声的存在非常敏感，本文引入一种判决门限,修正了传统过零率的计算。同时引入窗长动态改变

2009-09-14 15:54:53

基于片上系统SoC的孤立词语音识别算法设计

本文首先介绍了研究的孤立词语音识别系统，并针对片上系统进行了语音识别算法的选择。然后对基于语音帧的端点检测算法、线性预测编码倒谱系数LPCC 算法和动态时间规整DTW 算

2009-11-27 15:42:08

一种基于轮廓分析的图像特征点检测方法

图像特征点检测是图像匹配、目标识别以及运动估计等领域的一项关键技术。本文对图像轮廓二维信息进行降维处理，提出了一种特征点质量评价因子。利用该因子并结合文中给

2009-12-14 13:30:51

一种基于基音频率的实时性端点检测方法

端点检测是语音识别中的一项关键技术，端点检测的准确性对语音识别的结果有很大影响。本文提出一种引入自适应门限的基于基音频率的检测算法，并对文中提及的几种算法的

2009-12-16 12:34:32

基于小波变换多尺度Harris角点检测算法

提出一种新的基于小波变换的Harris 多尺度角点检测算法，可以在不同的尺度下获取角点，克服了单一尺度的Harris 角点检测算法可能存在的角点信息丢失和易受噪声影响而检测出

2010-01-09 11:18:25

基于片上系统SoC的孤立词语音识别算法设计

本文首先介绍了研究的孤立词语音识别系统，并针对片上系统进行了语音识别算法的选择。然后对基于语音帧的端点检测算法、线性预测编码倒谱系数LPCC算法和动态时间规整DTW算法

2010-07-17 17:05:50

过零点检测法的改进

介绍了过零点检测法的算法本人方法使用与大多普勒频偏信号

2010-09-07 15:39:00

多芯电缆断线点检测仪

多芯电缆断线点检测仪

2007-10-14 22:34:35

3153

多芯电缆断线点检测电路

多芯电缆断线点检测电路

2009-03-01 11:08:27

1597

零点检测电路

零点检测电路

2009-04-24 21:51:18

1054

语音压缩技术,语音压缩技术是什么意思

语音压缩技术,语音压缩技术是什么意思语音压缩技术指的是对原始数字音频信号流运用适当的数字信号处理技术，在不损失有用信息

2010-03-06 11:11:00

2068

青岛东软零点检测电路设计

为满足集中器识别表端相位和过零传输功能，在集中器跟表端增加零点检测电路，以判别市电过零点的时刻。 1、零点检测电路的实现零点检测电路的实现有多种方法，如三极管电路、光耦隔离电路等；每一种电路检测零点都有不同的偏差，为保证系统判决的准确性，硬

2011-03-15 12:05:03

100

基于FPGA的语音端点检测

端点检测的重要性不容忽视，尤其在噪声环境下语音的端点检测，它的准确性很大程度上直接影响着后续的工作能否有效进行

2011-03-17 11:48:57

2644

基于谐波分析的频带方差端点检测方法

语音端点检测的准确性直接影响着语音识别系统性能。在低信噪比环境下,一些在高信噪比环境下具有良好性能的检测方法无法有效工作。提出了基于谐波分析的频带方差和能量门限结

2011-08-22 15:46:08

基于双门限两级判决的语音端点检测方法

文中针对声纹识别系统所作的端点检测前端处理,对比了利用短时能量和短时平均过零率进行端点检测的方法,运用Matlab实现了双门限法端点检测的编程和仿真。仿真结果表明,端点检测准

2012-01-11 10:43:37

一种改进的语音端点检测方法研究

为了提高语音信号端点检测的准确率，提出了改进的端点检测方法。该方法在传统基于能量和过零率的端点检测方法基础上，加入第三道门限近似熵，对信号进行三级门限检测。仿真实

2012-03-20 10:56:49

基于单应性矩阵的棋盘格角点检测研究

针对三维视觉测量中棋盘格标定板的角点检测，给出了基于单应性矩阵这一计算机视觉重要工具为基础的检测方法。首先通过点选得到待测角点外接四边形的4个角点坐标，接着利用单应

2012-04-20 10:10:18

[3.6.1]--短时时域处理技术的应用--语音端点检测

自然语言处理

jf_90840116发布于 2022-12-19 21:09:49

灵云全智能能力平台之语音识别（ASR）能力服务

灵云语音识别技术经过多年的技术积累，以及在数千家企业用户的应用实践和磨合，具备了识别率高、响应速度快、支持话者分离和智能语音端点检测，口音和方言适应能力强等优点。

2016-03-23 18:17:05

1927

Harris角点检测

《OpenCV3编程入门》书本配套源代码:Harris角点检测

2016-06-06 15:20:54

Shi-Tomasi角点检测

《OpenCV3编程入门》书本配套源代码:Shi-Tomasi角点检测

2016-06-06 15:20:54

OpenCV3编程入门-源码例程全集-Harris角点检测

OpenCV3编程入门-源码例程全集-Harris角点检测

2016-09-18 16:38:46

传感器检测中的抗干扰技术详解

传感器检测中的抗干扰技术详解，学习资料，感兴趣的可以瞧一瞧。

2016-10-26 17:00:40

一种双门限语音端点检测算法的ASIC实现

一种双门限语音端点检测算法的ASIC实现

2017-01-07 20:32:20

PM2.5检测技术详解

2017-02-07 16:15:38

Harris角点检测在列车滑动监测系统中的应用_潘峥嵘

Harris角点检测在列车滑动监测系统中的应用_潘峥嵘

2017-03-19 11:26:54

灵云远场语音识别解决方案

醒、声源定向等关键技术，在引起产业界广泛关注的同时，16日正式宣布推出面向智能终端的完整灵云远场语音交互解决方案，该套方案完美整合了国内最新远场语音识别、语音唤醒、声源定向、降噪、回声消除、端点检测

2017-10-13 11:54:26

多路语音实时采集与压缩处理系统设计

语音数据压缩后的码流在10 Kbps左右时，需要采用语音的模型编码技术。而模型编码算法的运算量很大。因此，如一方面要求对多达8路的语音信号进行实时采集，另一方面又要求对各路的语音信号进行较高压缩率的实时压缩处理，对数据

2017-10-23 15:18:24

基于维纳滤波语音增强算法和语音端点检测算法的结合

在基于先验信噪比的维纳滤波语音增强算法的基础上，结合语音端点检测算法，本文提出一种新算法。新算法在语音端点检测的基础上，通过平滑处理更新噪声信号功率谱以适应噪声不稳定的环境；通过计算有声段噪声

2017-11-08 17:28:01

语音端点检测方法在智能家居中应用

提出了一种应用于智能家居的语音端点检测方法，综合利用语音信号的时域特性。设置了短时能量动态门限作为前端判定；对短时过零率算法做了抗干扰处理并结合平均幅度差函数做后期判定。实验结果表明，该算法能在室内信噪比较低的情况下准确地检测出语音信号，计算方法简单便于硬件实现，能够满足实时系统的需要。

2017-11-14 14:49:52

基于语音增强方法的语音端点检测

语音端点检测的检测结果好坏对后续的语音处理起着决定性的作用。为了解决语音端点在低信噪比情况下检测率不高的问题，该文提出了基于深度置信网络去噪的语音增强方法与传统的端点检测方法相结合的方法。该方法首先

2017-11-23 09:56:59

局部密度离群点检测算法

已有的密度离群点检测算法LOF不能适应数据分布异常情况离群点检测，INFLO算法虽引入反向五近邻点集有效地解决了数据分布异常情况的离群点检测问题，但存在需要对所有数据点不加区分地分析其k近邻和反向

2017-11-25 09:34:21

FAST特征点检测features2D

特征点检测和匹配是计算机视觉中一个很有用的技术。在物体检测，视觉跟踪，三维常年关键等领域都有很广泛的应用。这一次先介绍特征点检测的一种方法——FAST（features from

2017-11-29 09:10:49

3293

opencv角点检测原理详解

Moravec角点检测算子的思想其实特别简单，在图像上取一个W*W的“滑动窗口”，不断的移动这个窗口并检测窗口中的像素变化情况E。像素变化情况E可简单分为以下三种：A 如果在窗口中的图像是什么平坦

2017-12-04 11:42:06

10055

李洪亮：语音处理检测技术中的三个热点详解

，网络交互应用中的网络流量偏大，从而降低语音应用的成功率。因此，音频的端点检测、降噪和音频压缩始终是终端语音处理关注的重点，目前仍是活跃的研究主题。

2018-01-31 07:50:24

1526

一个新的信号奇异点检测方法

针对奇异信号中奇异点的检测和定位问题，提出了一个新的信号奇异点检测方法。根据脉冲奇异点的特点，首先将脉冲奇异点的检测建模为一个分类问题：信号中的脉冲奇异点为一类，非脉冲奇异点为另一类。然后

2018-02-12 15:42:15

智能机器人语音识别技术详细解析

能零积门限检测算法可以在不丢失语音信息的情况下，对语音进行准确的端点检测，经过450个孤立词（数字“0～9”）测试准确率为98％以上，经该方法进行语音分割后的语音，在进入识别模块时识别正确率达95％。

2019-06-12 10:52:10

12446

firefly人体特征点检测介绍

配置高清单目摄像头，可以清晰地检测人体关键特征点。人体骨骼特征点检测帧率15fps/640*480，检测精度95%；手指关键点检测帧率6fps/640*480，检测精度92%。

2019-11-05 16:07:11

1267

机器视觉检测技术的分类

一般来说，机器视觉检测技术依照检测功用可区别：定位、缺点检测、计数/遗失检测、尺度丈量。

2020-07-30 14:59:38

2995

微软为Linux服务器添加端点检测和响应功能

微软基于服务器的 Linux 保护计划的公开预览现在提供了改进的端点检测和响应功能。

2020-11-20 15:05:24

1928

热风无纺布污点检测系统实时检测的功能介绍

无锡赛默斐视科技有限公司，专注机器视觉表面瑕疵在线检测系统，是国内技术先进的高速板卷材表面缺陷在线检测系统的设备供应商，公司核心产品包括：薄膜表面瑕疵在线检测系统，无纺布污点检测仪，纸病在线检测系统

2021-01-21 16:51:00

608

关于薄膜在线污点检测系统的相关说明

精谱测控薄膜在线污点检测系统能够在线进行高速、精确的缺陷检测，并结合现场工艺在线报警、报表统计及产品分级处理，为企业确保产品质量提供有效的解决方案。精谱测控薄膜在线污点检测系统掌握核心的CCD工业

2021-03-12 16:44:10

430

纸张在线污点检测仪可有效检测出产品的瑕疵

、精确的检测。赛默斐视纸张在线污点检测仪能根据表面缺陷的特征，实时识别并对缺陷分类，结合现场工艺在线报警、报表统计及产品分级处理等。它广泛应用于新闻纸、特种纸、铜版纸、白板纸、美术纸、文化纸、香烟纸等产品的表面缺

2021-03-18 17:13:38

379

薄膜在线污点检测仪的检测对象是什么

导读：由于传统的人工肉眼检测速度慢、精度低、易于疲劳,不能满足现代生产要求。赛默斐视薄膜在线污点检测仪能在线对生产过程中产生的表面缺陷瑕疵进行高速、精确的检测，显示和识别薄膜表面上的所有表面缺陷

2021-03-19 15:58:43

298

关于泄漏点检测设备的介绍

近年来，随着科技的高速发展，已经进入人工智能时代，一些检测设备比如说泄漏点检测设备可以在一定程度上方便产品的研发与生产。如：汽车零部件配件、电子电器整机、安防/照明、医疗器械、连接线材、消费

2021-03-19 11:34:25

836

一种全新的棋盘角点检测方法

角点检测是摄像机校准的重要环节，可通过对棋盘图像进行角点检测来确定摄像机的内外参数，然而传统方法在检测棋盘角点时保留了较多的冗余信息，难以精确给出棋盘角点位置。为此，提出一种新的棋盘角点检测方法

2021-03-30 09:44:29

锂电隔膜污点检测系统的应用优势是什么

精谱测控锂电隔膜污点检测系统准确检测产品表面瑕疵问题——无锡精谱测控专注机器视觉表面瑕疵在线检测系统，如有需要可咨询详情！表面缺陷检测系统通过相机、图像处理算法等集成机器视觉技术，能高效地实时检测

2021-05-10 11:42:54

371

基于长时信号功率谱变化的语音端点检测方法

语音端点检测是语音信号处理的基础，为了提高在低信噪比及非平稳噪声下语音端点检测的准确性提出了一种基于长时信号功率谱变化的语音特征，利用阈值判决法验证了这一特征在语音端点检测中的应用前景。该方法首先

2021-05-12 16:32:48

精谱测控熔喷无纺布在线污点检测系统检测原理分析

无锡精谱测控技术有限公司自主研发设计的“精谱测控熔喷无纺布在线污点检测系统”核心研发团队均具有在中外机器图像视觉在线缺陷检测行业浸润多年，有丰富的“业界临床”经验。在行业内享有良好口碑声誉。年轻、活力、经验、创新、激情、持久、攀登。

2021-05-21 09:35:04

476

光学薄膜在线污点检测设备的主要检测范围说明

精谱测控光学薄膜在线污点检测设备可根据客户的具体需求搭建出符合要求的薄膜表面瑕疵缺陷检测系统，系统可以准确地识别薄膜生产中的瑕疵从而进行及时的反馈生产线表面的缺陷信息，并对这些瑕疵进行分类处理，比人

2021-05-28 10:00:04

297

基于MFCC的多维特征语音信号端点检测算法

为提髙复杂噪声环境下语音信号端点检测的准确率，提岀一种基于梅尔频谱倒谱系数（MFCC）距离的多维特征语音信号端点检测算法。通过计算语音信号的MrcC距离，结合短时能量和短时过零率对特征距离进行修正

2021-06-03 16:36:31

关于锂电隔膜污点检测仪检测原理的分析

线等）上的阵线相机高速扫描薄膜表面，通过无锡赛默斐视主研发的SIMV图像识别系统对薄膜表面缺陷进行识别。赛默斐视锂电隔膜污点检测仪原理：视觉系统的输出并非图像视频信号，而是经过运算处理之后的检测结果(如缺陷、尺寸等数据

2021-06-04 17:13:53

439

无纺布在线污点检测系统的原理、参数及功能

疵点是影响无纺布质量等级的最主要因素，疵点检测是其质量管理的重要环节。传统的布匹疵点检验依靠人工主观判别，缺乏检验的一致性和可靠性。随着现代工业发展对无纺布质量和产量需求的日益增长，人工检测的精度和速度均不能满足要求，基于机器视觉的疵点检测技术已经成为了研究热点和发展趋势。

2021-06-15 10:04:12

374

增强区域全卷积网络下的炸点检测方法

野外大视场环境下的炸点检测常采用图像帧间差分的方法，但由于弹体落地后炸点分布的情况复杂，对密集炸点的检测成为了难点问题。针对该问题，将炸点图像经过整理、分类，构建了炸点检测的专用数据集。在此基础上

2021-06-21 14:19:34

无纺布污点检测仪检测的原理、参数及配置

由于各种因素，无纺布的表面在生产过程中会产生污点、节点等各种缺陷等，严重影响产品的质量和企业形象。赛默斐视无纺布污点检测仪基于先进的机器视觉技术并结合无纺布稀疏和纹理特点采用正面照射，反面透射结合

2021-07-05 09:26:48

742

薄膜污点检测系统的工作原理

精谱测控薄膜污点检测系统：高效率检测服务商——随着工业现代化发展，传统的人工检测已不能适应高速的生产线和产品高质量的要求，越来越需要与生产现代预支配套的自动化检测系统来取代人检测，视觉智能化检测的应用，为表面瑕疵检测提出了新的解决方案，实现了表面瑕疵检测与生产自动化系统的无缝对接。

2021-07-08 16:07:06

234

无纺布在线污点检测系统的原理及功能

精谱测控无纺布在线污点检测系统检测原理——目前对无纺布缺陷进行检测主要是通过人工检测的方法来解决，然而这种方法的检测处理速度比较慢，同时会给工人造成比较高的劳动强度，最终的检测效果也同时会极大地受到

2021-08-01 09:22:40

321

无纺布表面污点检测设备的原理及功能

精谱测控无纺布表面污点检测设备高品质表面质量检测——目前对无纺布缺陷进行检测主要是通过人工检测的方法来解决，然而这种方法的检测处理速度比较慢，同时会给工人造成比较高的劳动强度，最终的检测效果也同时

2021-08-04 09:56:04

363

无纺布在线污点检测仪的优势介绍

无纺布在线污点检测仪的优势介绍——无锡赛默斐视技术有限公司专业表面瑕疵在线检测，可根据客户需求定制。无锡赛默斐视无纺布在线污点检测仪是采用先进的机器视觉检测技术，对工件表面的斑点、凹坑、划痕、色差

2021-10-20 17:22:41

198

气压可视泄漏点检测仪工作具体流程

气压可视泄漏点检测仪气压可视泄漏点检测仪工作具体流程是用于手机、智能手环、智能手表水下灯等水下产品泄漏点检测的防水测试设备，用来确定做了防水或者密封处理的电子产品的泄漏点，那么气压可视泄漏点检测

2021-11-12 16:38:34

548

PFLD：一个实用的人脸关键点检测器

人脸关键点检测是一个非常核心的算法业务，其在许多场景中都有应用。比如我们常用的换脸、换妆、人脸识别等2C APP中的功能，都需要先进...

2022-02-07 12:33:54

基于SSD的织物瑕疵点检测系统

织物疵点图像检测结果随着深度学习技术飞速发展，以及计算机等硬件水平的不断提升，卷积神经网络在工业现场的应用将随之不断扩大，织物表面疵点检测作为工业表面检测的代表性应用产业，其应用发展将影响着整个工业领域。

2022-11-21 09:44:59

1192

语音芯片有损压缩技术的种类有哪些

由于语音数据量庞大，对语音数据进行有效压缩是很必要的，能够使我们在有限的ROM空间里录入更多的语音内容。而语音压缩技术一般分为两种类型：无损语音压缩技术和有损语音压缩技术，由于无损压缩率较低而且成本昂贵，不易存储和传输，因此只有一些专业的HIFI需要用到。

2022-12-09 11:36:08

910

用于实时PCR扩增或LAMP终点检测的微流控芯片

本文提出一种高通量微流控芯片可用于实时PCR扩增或LAMP终点检测，其检测限可低至 1 copy/ul。

2023-01-29 14:00:50

891

非隔离型和隔离型过零点检测电路设计

，而过零点处其电压变化率是最快的，所以其检测误差是最小的。故此，我们在此只介绍过零点检测电路。下面结合实际项目说说过零点检测电路。

2023-03-17 18:16:34

1887

露点检测仪的维护

露点检测仪的维护。在线式露点仪，便携式露点仪的维护保养

2023-05-13 14:00:54

924

语音芯片压缩技术主要有哪些？

由于语音数据量庞大，对语音数据进行有效压缩是很必要的，能够使我们在有限的ROM空间里录入更多的语音内容。而语音压缩技术一般分为两种类型：无损语音压缩技术和有损语音压缩技术，由于无损压缩率较低而且成本

2022-12-12 10:17:47

480

语音处理降噪消回音产品手册

语音处理降噪消回音产品.

2023-08-14 18:05:38

已全部加载完成

搜索历史

语音处理检测技术端点检测、降噪和压缩详解 - 全文

本文导航

评论