首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
语音端点检测(voice activity detection,VAD)是在连续语音信号中,将语音和非语言片段分离的技术。VAD在语音识别、说话人识别、语音编码等领域起着重要作用。传统VAD算法在类型已知的噪声环境下可以达到较好的性能,但在实际情况中,未知噪声的影响通常会使系统性能下降显著,在差异化噪声下的VAD是端点检测的研究难点。在总结现有语音端点检测算法基础上,提出了一种基于深度神经网络的语音端点检测方法,同时结合维特比算法,与基于贝叶斯信息准则(bayesian information criterion, BIC)的混合高斯模型(gaussian mixture model,GMM) 语音端点检测系统进行对比,在大词汇连续语音识别系统中的实验结果表明,将深度神经网络结合维特比算法,应用于语音端点检测,在复杂噪声环境下取得了更好的效果,适应性更强。  相似文献   

2.
一种基于噪声动态检测的语音端点检测算法   总被引:1,自引:0,他引:1  
HMM技术在语音识别中得到较为成功的应用.本文基于HMM的孤立词语音识别系统的识别策略,提出了两个改进的算法.第一种算法是对背景噪声进行动态估计的汉语语音端点检测算法,较一些常规的端点检测方法如基于能量的端点检测方法,具有更高精度和鲁棒性,第二种算法针对分裂法进行码本设计时,可能出现除数为零的计算错误,提出了避免出现计算错误的改进算法.通过进行汉语孤立词语音识别实验,表明这两种算法是有效的,得到较高的识别率.  相似文献   

3.
HMM技术在语音识别中得到较为成功的应用,本文基于HMM的孤立词语音识别系统的识别策略,提出了两个改进的算法.第一种算法是对背景噪声进行动态估计的汉语语音端点检测算法,较一些常规的端点检测方法如基于能量的端点检测方法,具有更高精度和鲁棒性.第二种算法针对分裂法进行码本设计时,可能出现除数为零的计算错误,提出了避免出现计算错误的改进算法.通过进行汉语孤立词语音识别实验,表明这两种算法是有效的,得到较高的识别率.  相似文献   

4.
随着普通话水平考试的普及,普通话水平测试系统的自动化变得日益迫切。为了建立自动的普通话水平测试系统,如何快速准确的对普通话测试命题说话内容进行缺时检测是一个关键问题。将语音信号分成若干窗口,采用EMD分解算法将窗口信号分解为若干IMF。在每一窗口上利用Hilbert-Huang变换获取每个IMF分量的瞬时幅值和频率。利用瞬时幅值和频率构造每个IMF分量的能频值。将所有IMF分量的能频值组成该段的能频值特征向量,利用该能频值特征向量来区分信号中的静音段和语音段。最后通过计算相邻静音段的最大时长判断是否缺时,并采用一种规则消除因强噪声信号而引起的某一段能频值过大的影响。实验表明,笔者所设计的算法对普通话水平考试中的缺时检测有良好的效果。  相似文献   

5.
6.
针对基音检测中的倍频、半频误差问题,提出了一种新的基于优化能量值门限和增强倍频效应的抗噪基音检测改进算法.该算法首先通过修改频谱能量值门限来优化半频误差,然后通过音频特有的倍频效应,取相邻的基频与泛频或泛频与泛频做差,从而得到基音频率,来优化倍频误差.结果表明:所改进的基音检测算法不仅保留了对共振峰的高容忍度,而且大幅提高了在低频区域和高频区域的音频识别能力;该方法比传统基音检测方法不论是在有噪音还是无噪音、高信噪比还是低信噪比的情况下都更加优秀,尤其体现在100Hz以下的低频区域和800Hz以上的高频区域.  相似文献   

7.
在语音信号处理系统中,基于帧能量的语音端点检测(voiceactivitydetection,VAD)往往受到语音段能量不平稳及噪声的影响,为了提高语音端点检测的性能和鲁棒性,引入视觉信息。该文提出采用基于数据驱动的线性变换生成视觉特征,在提出一个基于统计的VAD一般模型的基础上构建两个单模式的VAD系统,通过两步式的融合方法,得到了多模式的VAD系统。实验表明:同时利用音频和视觉信息的多模式VAD比基于帧能量的听觉VAD在帧错误率上有55.0%的相对下降,在断句错误率上有98.5%的相对下降。这一结果说明多模式VAD方法基本可以避免断句错误,也能够显著改善帧检测性能,是一种相当有效的方法。  相似文献   

8.
基于短时能零积和鉴别信息的语音端点检测   总被引:1,自引:0,他引:1  
为了提高低信噪比下语音端点检测的准确率,提出了一种新型的语音端点检测算法.该算法利用短时能零积法和鉴别信息的互补优势,一边降噪一边端点检测,而且对于被判为噪声的帧利用基于子带能量鉴别信息方法来进行二次复检,根据鉴别信息来更新噪声能量门限,从而能更准确地跟踪噪声的能量变化.实验结果表明,该方法在信噪比变化比较剧烈的情况下仍然能够准确地进行端点检测,对语音信号的后续处理起到了很好的作用.  相似文献   

9.
语音信号端点检测方法研究   总被引:1,自引:0,他引:1  
介绍了语音信号的3种端点检测方法.即能量过零率检测方法、基于频带方差的检测方法和语音短时信息熵检测方法,并对3种方法的优缺点进行分析.  相似文献   

10.
语音信号识别系统预处理阶段中一个关键步骤是语音信号的端点检测,其精准性直接决定了整个语音识别系统的识别效果. 传统的短时能量和短时过零率双门限检测法中后端点检测存在偏差,且在有噪声的情况下鲁棒性较差. 从动态阈值、短时平均过零率、端点修复、动态检测等方面入手,改进了双门限检测法. 优化了的端点检测算法,使得语音识别系统能够更精确地识别和提取语音,减少了语音识别时间,提高了识别率. 进一步将无用信号和语音信号完全分离开来,有利于后续语音识别的研究.  相似文献   

11.
一种有效的语音基音周期提取算法   总被引:2,自引:0,他引:2  
语音信号处理中精确提取特定语音的基音周期有重要的意义.采用了一种有效方法,即在浊音中用段内位移匹配的方法提取出基音周期,有效地防止由于一个周期内的2段相似波形被误判为两个周期的情况,同时也防止取到倍周期的可能.实验证实,此方法提取出的基音周期准确,能较好地合成出特定人的语音来.  相似文献   

12.
基音是指人们发浊音时声带振动所引起的周期性,而声带振动频率的倒数就是基音周期.语音信号处理中精确提取特定语音的基音周期有重要的意义,基音周期的检测无论在语音信号的合成、编码还是识别方面,都起着非常重要的作用.该文依据数字语音信号的特点,设计了一种用于语音处理的层叠滤波算法,合理选择结构元素构筑了一组用于汉语语音基音轨迹平滑的层叠滤波器,仿真实验结果表明,这种方法对于随机误判点与传统的基于中值与线性平滑的组合平滑相比效果更佳,同时也证明了层叠滤波器用于语音信号研究的可行性.  相似文献   

13.
基音周期提取是语音编码和语音识别领域的一项重要研究课题。为了解决传统的自相关方法容易出现的半频倍频错误,提出了基于时域和频域分析的提取算法。该算法首先提取时域自相关值最大的若干个候选值;然后统计每个候选值对应的频域上所有相邻两个谐波能量和的最大值,用来对其自相关值进行加权;最后根据历史的基音周期值以及候选基音周期所对应的频域能量值对加权值进行修正。使用Keele数据库进行测试表明,使用该算法后基音周期提取的半频倍频错误率比传统算法下降了50%左右。  相似文献   

14.
提出一种基于基频状态和帧间相关性的单通道混合语音分离算法.首先,从混合语音中提取2个源语音的基频进行状态编码,基于编码的基频状态构造自适应字典,并通过引入基频信息在字典层面对各源语音信号进行区分.然后,采用频繁模式挖掘算法,提取基频状态为1时字典的频繁1项子集,缩减字典尺寸.最后,以基于正交匹配追踪的分离语音为基础,检测分离效果差的混合语音帧,搜索与其相关度最高的平移后的邻近分离语音帧进行叠加,并采用软掩蔽方法进行第二次分离校正.仿真实验结果表明,该算法获取的分离语音信噪比优于现有的2种经典语音分离算法,并且该算法采用频繁模式挖掘算法大大减小了运算量.  相似文献   

15.
通过对基音周期慢时变特性的研究,提出了一种改进的MBE基音跟踪算法.该算法旨在减少运算量,提升基音检测的实时性,将传统的基音跟踪算法改进为前后向各跟踪一帧.仿真实验表明,改进算法与传统算法对基音跟踪均取得了良好的效果,但是新算法计算量大幅度减少,执行速度明显提升.  相似文献   

16.
付永庆  孙滢 《应用科技》2007,34(12):4-7
提出了一种水印信号与载体信号均为语音的数字音频水印算法.主要由用混沌序列对音频水印加密,基于载体信号基音周期估计确定水印嵌入位置和根据量化步长△确定水印嵌入强度等关键步骤所组成.仿真结果表明,该算法不仅具有较好的透明性,而且也对叠加噪声、低通滤波、重新采样等攻击具有较好的鲁棒性.  相似文献   

17.
为了提高在噪声环境下语音识别系统的性能,对基于子带独立感知理论的语音识别方法进行了研究.这些方法利用人耳对不同频率信号感知的差异,以及噪声和识别对象的频域特征差异,分别采用线性分析、判决分析、多层感知机以及子带最大似然估计对噪声影响进行补偿.实验表明,子带分析采用非线性策略优于线性策略.基于独立感知假定的子带模型,虽然由于独立性假定丢失了带间相关性,但对于噪声环境下语音识别而言可以捕获噪声和识别对象的频谱差异,从而获得比全带分析更高的鲁棒性.  相似文献   

18.
采用语音合成方法完成了汉语人名语音库的设计.声母部分直接采用录音样本,而韵母部分则通过激励声道频率响应函数来合成语音,然后通过声韵母拼接来实现人名语音合成,以此建立人名语音库.可以实现各种可能人名语音的合成,适合应用于多种电子自助系统中.  相似文献   

19.
为提高识别率和识别效率,采用双门限过零率和短时能量作为端点检测的依据,提取Mel频率倒谱系数作为语音特征参数,并使用DTW算法进行模式匹配.由于传统DTW算法计算量大,所以采用局部路径约束和区域约束进行改进,并用Matlab对改进后的DTW算法进行了仿真.实验证明该算法对孤立词语音识别能够达到较好的识别结果.  相似文献   

20.
采用模式匹配的识别技术,建立孤立词语音识别系统,基于MATLAB环境对O~9这10个数字语音进行仿真实验.在提取MFCC的基础上,整合差分倒谱参数作为语音的特征参数,并对现有的DTW算法加以改进,节省了系统匹配的计算时间,使其具有一定的鲁棒性.分别采集普通话语音和湖北、闽南、安徽3地方言的语音数据,体现了数据的完备性和系统的适用性.实验结果表明,基于改进型DTW算法和MFCC的语音识别系统具有较高识别率,取得了良好效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号