首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
语音端点检测(voice activity detection,VAD)是在连续语音信号中,将语音和非语言片段分离的技术。VAD在语音识别、说话人识别、语音编码等领域起着重要作用。传统VAD算法在类型已知的噪声环境下可以达到较好的性能,但在实际情况中,未知噪声的影响通常会使系统性能下降显著,在差异化噪声下的VAD是端点检测的研究难点。在总结现有语音端点检测算法基础上,提出了一种基于深度神经网络的语音端点检测方法,同时结合维特比算法,与基于贝叶斯信息准则(bayesian information criterion, BIC)的混合高斯模型(gaussian mixture model,GMM) 语音端点检测系统进行对比,在大词汇连续语音识别系统中的实验结果表明,将深度神经网络结合维特比算法,应用于语音端点检测,在复杂噪声环境下取得了更好的效果,适应性更强。  相似文献   

2.
一种基于噪声动态检测的语音端点检测算法   总被引:1,自引:0,他引:1  
HMM技术在语音识别中得到较为成功的应用.本文基于HMM的孤立词语音识别系统的识别策略,提出了两个改进的算法.第一种算法是对背景噪声进行动态估计的汉语语音端点检测算法,较一些常规的端点检测方法如基于能量的端点检测方法,具有更高精度和鲁棒性,第二种算法针对分裂法进行码本设计时,可能出现除数为零的计算错误,提出了避免出现计算错误的改进算法.通过进行汉语孤立词语音识别实验,表明这两种算法是有效的,得到较高的识别率.  相似文献   

3.
HMM技术在语音识别中得到较为成功的应用,本文基于HMM的孤立词语音识别系统的识别策略,提出了两个改进的算法.第一种算法是对背景噪声进行动态估计的汉语语音端点检测算法,较一些常规的端点检测方法如基于能量的端点检测方法,具有更高精度和鲁棒性.第二种算法针对分裂法进行码本设计时,可能出现除数为零的计算错误,提出了避免出现计算错误的改进算法.通过进行汉语孤立词语音识别实验,表明这两种算法是有效的,得到较高的识别率.  相似文献   

4.
在语音信号的低码率参数编码算法中,准确地提取基音信息是一个重要环节,文中对基于正弦波语音模型的频域基音检测算法的运算量大、易受共振峰干扰等问题提出了改进,改进后算法的运算量小,算法的准确性高,有效地减小了共振峰对频域基音检测算法的影响,模拟实验表明,改进算法的运算量仅为原算法的13%。  相似文献   

5.
随着普通话水平考试的普及,普通话水平测试系统的自动化变得日益迫切。为了建立自动的普通话水平测试系统,如何快速准确的对普通话测试命题说话内容进行缺时检测是一个关键问题。将语音信号分成若干窗口,采用EMD分解算法将窗口信号分解为若干IMF。在每一窗口上利用Hilbert-Huang变换获取每个IMF分量的瞬时幅值和频率。利用瞬时幅值和频率构造每个IMF分量的能频值。将所有IMF分量的能频值组成该段的能频值特征向量,利用该能频值特征向量来区分信号中的静音段和语音段。最后通过计算相邻静音段的最大时长判断是否缺时,并采用一种规则消除因强噪声信号而引起的某一段能频值过大的影响。实验表明,笔者所设计的算法对普通话水平考试中的缺时检测有良好的效果。  相似文献   

6.
7.
针对基音检测中的倍频、半频误差问题,提出了一种新的基于优化能量值门限和增强倍频效应的抗噪基音检测改进算法.该算法首先通过修改频谱能量值门限来优化半频误差,然后通过音频特有的倍频效应,取相邻的基频与泛频或泛频与泛频做差,从而得到基音频率,来优化倍频误差.结果表明:所改进的基音检测算法不仅保留了对共振峰的高容忍度,而且大幅提高了在低频区域和高频区域的音频识别能力;该方法比传统基音检测方法不论是在有噪音还是无噪音、高信噪比还是低信噪比的情况下都更加优秀,尤其体现在100Hz以下的低频区域和800Hz以上的高频区域.  相似文献   

8.
在语音信号处理系统中,基于帧能量的语音端点检测(voiceactivitydetection,VAD)往往受到语音段能量不平稳及噪声的影响,为了提高语音端点检测的性能和鲁棒性,引入视觉信息。该文提出采用基于数据驱动的线性变换生成视觉特征,在提出一个基于统计的VAD一般模型的基础上构建两个单模式的VAD系统,通过两步式的融合方法,得到了多模式的VAD系统。实验表明:同时利用音频和视觉信息的多模式VAD比基于帧能量的听觉VAD在帧错误率上有55.0%的相对下降,在断句错误率上有98.5%的相对下降。这一结果说明多模式VAD方法基本可以避免断句错误,也能够显著改善帧检测性能,是一种相当有效的方法。  相似文献   

9.
基于短时能零积和鉴别信息的语音端点检测   总被引:1,自引:0,他引:1  
为了提高低信噪比下语音端点检测的准确率,提出了一种新型的语音端点检测算法.该算法利用短时能零积法和鉴别信息的互补优势,一边降噪一边端点检测,而且对于被判为噪声的帧利用基于子带能量鉴别信息方法来进行二次复检,根据鉴别信息来更新噪声能量门限,从而能更准确地跟踪噪声的能量变化.实验结果表明,该方法在信噪比变化比较剧烈的情况下仍然能够准确地进行端点检测,对语音信号的后续处理起到了很好的作用.  相似文献   

10.
垃圾处理的能值分析   总被引:2,自引:3,他引:2  
采用能值分析方法,对处理垃圾的几种常见方式进行了分析,并对其系统的能值投资率(EIR)和能值产出率(EYR)进行了计算.结果表明,填埋及沼气发电、焚烧发电的EYR稍大于1,堆肥系统的EYR小于1.填埋及沼气发电、焚烧发电虽然显示出一定的应用前景,但它们的EYR还偏小,这说明目前我国垃圾处理系统的运行还离不开政府的支持与新技术的应用.堆肥系统的EYR较小,但由于它的EIR也较低,可以以较低的社会能值投入达到垃圾处理的目的,因此目前暂时也有它存在的价值.  相似文献   

11.
一种有效的语音基音周期提取算法   总被引:2,自引:0,他引:2  
语音信号处理中精确提取特定语音的基音周期有重要的意义.采用了一种有效方法,即在浊音中用段内位移匹配的方法提取出基音周期,有效地防止由于一个周期内的2段相似波形被误判为两个周期的情况,同时也防止取到倍周期的可能.实验证实,此方法提取出的基音周期准确,能较好地合成出特定人的语音来.  相似文献   

12.
基音是指人们发浊音时声带振动所引起的周期性,而声带振动频率的倒数就是基音周期.语音信号处理中精确提取特定语音的基音周期有重要的意义,基音周期的检测无论在语音信号的合成、编码还是识别方面,都起着非常重要的作用.该文依据数字语音信号的特点,设计了一种用于语音处理的层叠滤波算法,合理选择结构元素构筑了一组用于汉语语音基音轨迹平滑的层叠滤波器,仿真实验结果表明,这种方法对于随机误判点与传统的基于中值与线性平滑的组合平滑相比效果更佳,同时也证明了层叠滤波器用于语音信号研究的可行性.  相似文献   

13.
基音周期提取是语音编码和语音识别领域的一项重要研究课题。为了解决传统的自相关方法容易出现的半频倍频错误,提出了基于时域和频域分析的提取算法。该算法首先提取时域自相关值最大的若干个候选值;然后统计每个候选值对应的频域上所有相邻两个谐波能量和的最大值,用来对其自相关值进行加权;最后根据历史的基音周期值以及候选基音周期所对应的频域能量值对加权值进行修正。使用Keele数据库进行测试表明,使用该算法后基音周期提取的半频倍频错误率比传统算法下降了50%左右。  相似文献   

14.
提出一种基于基频状态和帧间相关性的单通道混合语音分离算法.首先,从混合语音中提取2个源语音的基频进行状态编码,基于编码的基频状态构造自适应字典,并通过引入基频信息在字典层面对各源语音信号进行区分.然后,采用频繁模式挖掘算法,提取基频状态为1时字典的频繁1项子集,缩减字典尺寸.最后,以基于正交匹配追踪的分离语音为基础,检测分离效果差的混合语音帧,搜索与其相关度最高的平移后的邻近分离语音帧进行叠加,并采用软掩蔽方法进行第二次分离校正.仿真实验结果表明,该算法获取的分离语音信噪比优于现有的2种经典语音分离算法,并且该算法采用频繁模式挖掘算法大大减小了运算量.  相似文献   

15.
通过对基音周期慢时变特性的研究,提出了一种改进的MBE基音跟踪算法.该算法旨在减少运算量,提升基音检测的实时性,将传统的基音跟踪算法改进为前后向各跟踪一帧.仿真实验表明,改进算法与传统算法对基音跟踪均取得了良好的效果,但是新算法计算量大幅度减少,执行速度明显提升.  相似文献   

16.
在藏语语音处理中基音周期的检测具有非常重要的意义.本文首先讨论了用自相关函数法进行基音周期检测的基本原理及其改进方法,进而研究了这种方法在藏语语音处理中的应用,并给出了相应的实例.  相似文献   

17.
付永庆  孙滢 《应用科技》2007,34(12):4-7
提出了一种水印信号与载体信号均为语音的数字音频水印算法.主要由用混沌序列对音频水印加密,基于载体信号基音周期估计确定水印嵌入位置和根据量化步长△确定水印嵌入强度等关键步骤所组成.仿真结果表明,该算法不仅具有较好的透明性,而且也对叠加噪声、低通滤波、重新采样等攻击具有较好的鲁棒性.  相似文献   

18.
为了提高在噪声环境下语音识别系统的性能,对基于子带独立感知理论的语音识别方法进行了研究.这些方法利用人耳对不同频率信号感知的差异,以及噪声和识别对象的频域特征差异,分别采用线性分析、判决分析、多层感知机以及子带最大似然估计对噪声影响进行补偿.实验表明,子带分析采用非线性策略优于线性策略.基于独立感知假定的子带模型,虽然由于独立性假定丢失了带间相关性,但对于噪声环境下语音识别而言可以捕获噪声和识别对象的频谱差异,从而获得比全带分析更高的鲁棒性.  相似文献   

19.
随着人工智能物联网(artificial intelligence & internet of things, AIoT)的发展, 硬件技术的飞速进步, 更多的智能音箱进入人们的生活, 人机交互方式也从早期的遥控变成了人声控制. 但设备中麦克风采集到的语音信号往往含有大量噪声和干扰人声, 为此需对麦克风采集到的语音进行语音分离处理. 常用的技术有频域独立成分分析(independent component analysis, ICA), 但是频域ICA存在次序不确定性问题, 即将分离出的源1分量分类到源2通道, 将分离出的源2分量分类到源1通道, 从而导致分离性能大大降低. 为此, 提出一种基于语音能量比来解决频域ICA中次序不确定性问题的算法, 有效地提高了分离性能. 在SiSEC(Signal Separation Evaluation Campaign)、ChiME(Challenge for Computational Hearing in Multisoure Environments)数据集上对分离性能进行实验, 所得结果比已有算法均有提升, 且针对强混响环境下的混合信号依然保持良好的分离性能.  相似文献   

20.
Mel 频率下基于 LPC 的语音信号深度特征提取算法   总被引:1,自引:0,他引:1  
针对传统语音信号二次特征提取方法在保证识别率的前提下,实时性较差的问题,提出一种Mel频率下基于线性预测系数(linear predictive coefficient,LPC)的改进的语音信号深度特征提取算法.该方法根据人耳的听觉特性把LPC在Mel频率下进行非线性变换,再进行微分、高阶微分和按比例重组等步骤,得到一种既考虑声道激励又兼顾人耳听觉的新特征参数,从而大大减少传统语音信号深度特征提取的计算量,在不影响识别效率的情况下,极大提高系统的实时性.最后,将该算法在智能轮椅平台进行有效性验证,大量实验表明,语音控制系统实时性差的问题在使用该算法后能够得到明显改善,该算法既保证了特征提取识别率,也有效地改善了系统的实时性.在一定程度上使语音控制智能轮椅更具实用性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号