首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相加(MFCC_a),再与短时能量相除(梅尔能量比)作为语音特征参数的语音端点检测测度,最后利用模糊C均值聚类算法自适应确定双门限阈值进行端点检测.选取TIMIT语音库中的50条语音信号进行实验,结果表明:在信噪比为5 dB、0 dB、-5 dB的噪声环境下,与能零比、谱熵等算法相比,本算法端点识别准确率均有所提高,其中在-5 dB信噪比环境下提升了约30%.  相似文献   

2.
基于扩展谱相减与SAP的带噪语音端点检测   总被引:2,自引:0,他引:2  
为提高低信噪比时带噪语音端点检测的性能,提出了一种将扩展的谱相减法与SAP(Speech AbsenceProbab ility)软门限相结合的方法。采用基于噪声补偿结构的扩展谱相减法,通过使用自适应的判决规则,在不需要进行语音激活检测的情况下有效地去除了背景噪声,克服了单麦克输入时无法在语音段对噪声进行估计的缺点。同时采用非语音段概率SAP软门限,直接对增强后的语音信号进行检测,有效提高了语音段起止端点检测的精确度和可靠性。实验结果表明,该方法比短时能量方法的计算效率高,在信噪比为-10 dB时仍能完成端点检测。  相似文献   

3.
针对固定门限方法在语音端点检测技术中的局限性,为了提高低信噪比下语音端点检测的鲁棒性和准确率,将自适应门限应用于分形维数的语音检测中,提出了一种新的语音端点检测算法.该算法通过对语音信号产生机制的分析,将分形维数用于语音起止点的检测中,设计了自适应门限,从而有效降低了噪声干扰对检测结果的影响,并实现了实时检测.仿真实验结果表明,在低信噪比的情况下,改进的端点检测算法比传统的短时能量检测算法可更准确有效地实现带噪语音的端点检测,而且对噪声干扰具有更好的鲁棒性.  相似文献   

4.
李明 《科技资讯》2011,(10):26-27
提出了一种时频结合的带噪语音端点检测方法。选取时域短时能量和频域熵构成一个新的特征,采用自适应门限进行端点检测。实验结果表明该方法在低信噪比环境下较传统方法提高了端点检测的准确率,鲁棒性较好。  相似文献   

5.
分形理论在语音信号端点检测及增强中的应用   总被引:8,自引:1,他引:7  
为了提高现有谱相减方法处理低信噪比语音信号的效果,利用时间序列信号的短时分形维数对低信噪比语音信号的端点检测方法进行了研究,提出了一种基于端点检测的谱相减语音增强方法,给出了其原理及具体算法.仿真实验结果表明,该方法简单可靠,有效可行,当语音信号信噪比降到-5 dB时仍然有效;与已有方法相比,具有更广泛的实用性.  相似文献   

6.
在噪声环境下,利用短时平均幅度为特征进行语音端点检测.文章在传统端点检测算法的基础上,研究了汉语音节的特点,提出采用短时平均幅度代替短时能量,并为平均幅度引入判决门限.门限值是根据语音信号背景噪声自动计算得到,从而保证了算法在噪声环境下检测的准确性.实验结果表明,与传统的基于短时能量的端点检测算法相比,改进的算法在高信噪比和低信噪比环境下都具有良好的性能.  相似文献   

7.
低信噪比下基于谱熵的语音端点检测算法   总被引:14,自引:0,他引:14  
为提高语音端点检测系统在低信噪(0 dB以下)下检测的准确率,提出了一种基于谱熵的端点检测算法。将每帧信号分为16个子带,选取频谱分布在250~3.5 kH z并且能量不超过该帧总能量90%的子带,计算经过语音增强后的子带能量以及各子带信噪比,根据各子带信噪比的不同调整其在整个谱熵计算过程中的权重,然后平滑谱熵,以最终的谱熵作为端点检测的依据。实验结果表明,此方法在较低的信噪比下能够显著地提高端点检测的准确率。对坦克噪声,检测效果明显优于G.729中的端点检测算法,即使在-5 dB的信噪比下,仍然可以达到95%以上的检测率。  相似文献   

8.
本文应用时间序列领事的短时分莆维维数的非线性理论,对低信噪比的语音信号端点检测呼自适应滤波进行了研究,针对信噪比在0dB和-5dB的噪声语音信号的端点检测和波进行了计算机仿真实验。实验结果表明,短时分形维维数能较准确地进行语音端点的检测,并且,基于短时分形维维数的自适应滤波器也具有明显的滤波效果。  相似文献   

9.
基于短时能零积和鉴别信息的语音端点检测   总被引:1,自引:0,他引:1  
为了提高低信噪比下语音端点检测的准确率,提出了一种新型的语音端点检测算法.该算法利用短时能零积法和鉴别信息的互补优势,一边降噪一边端点检测,而且对于被判为噪声的帧利用基于子带能量鉴别信息方法来进行二次复检,根据鉴别信息来更新噪声能量门限,从而能更准确地跟踪噪声的能量变化.实验结果表明,该方法在信噪比变化比较剧烈的情况下仍然能够准确地进行端点检测,对语音信号的后续处理起到了很好的作用.  相似文献   

10.
语音端点检测是语音识别预处理的一个重要环节,语音端点判断正确与否直接影响到语音识别的效果。短时能量法与过零率方法是语音端点检测的两类主要方法,融合这两类算法,并结合短时频谱峰值,归纳总结了4条语音端点检测的融合检测准则。在语音分段时提出自适应逐级分段计算,寻找满足误差要求的语音起始和终止端点。语音实验验证了本文所提语音自适应分段融合检测方法的有效性,同时,该方法没有增加语音端点检测的额外计算量。  相似文献   

11.
语音端点检测是语音识别中非常重要的部分,识别率高低很大程度上取决于端点检测的精确程度。在高信噪比(signal-noise ratio,SNR)的实验室环境下,端点检测有很好的效果;但比如像工厂和市场等低SNR环境下,传统的检测方法性能迅速降低,端点检测无法达到预期效果。针对低SNR语音的端点检测,先通过谱减法对带噪语音进行降噪,再分别求出每帧语音信号的能量与频带方差的乘积,将乘积值作为参数进行双门限端点检测的思路,提出了一种能量和频带方差结合的端点检测方法。将TIMIT数据集中语音叠加高斯随机噪声、NOISEX 92噪声库中的factory噪声和volvo噪声进行实验。结果表明,当SNR在-10 d B时,仍有较好的检测效果,显著提高了语音端点检测的效果。  相似文献   

12.
一种新的对数能量谱熵语音端点检测方法   总被引:1,自引:0,他引:1  
将一种新的对数能量(LE)特征和谱熵(SE)特征相结合,提出一种新的对数能量谱熵(LESE)特征,采用模糊C均值聚类算法和贝叶斯信息准则算法进行LESE特征门限估计,并使用双门限法进行语音端点检测.在TIMIT连续语音库上的实验结果表明,相比于能量谱熵(EE)法和对数能量(LE)法,在噪声环境下LESE法具有更好的检测性能,表现出更好的稳健性.当信噪比为-5 dB时,LESE法的检测错误率仅为18.02%,在信噪比为0~10 dB时,其检测错误率要明显低于EE法和LE法.  相似文献   

13.
应用倒谱特征的带噪语音端点检测方法   总被引:7,自引:0,他引:7  
传统的语音端点检测方法以信号的短时能量、过零率等简单特征为判决特征参数。这些方法在实际应用中,尤其当信号噪比比较低时,无法满足系统的需要。文中利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法和循环神经网络法,通过对宽带噪声-白噪声干扰情况和一种特殊噪声-汽车噪声情况的实验,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有传统的能量方法无法比拟的优越性,更适  相似文献   

14.
噪声环境下语音识别方法研究   总被引:5,自引:0,他引:5  
研究了6种噪声背景下与说话人有关的孤立词语音识别方法。它们是:线性预测误差法,单边自相关线性预测法,语音前端声学处理法,正则相关分析的谱变换补偿方法,特征综合法和同模极点增加法。实验结果表明,这6种方法都有效地提高了噪声环境中语音识别率,其中较好的方法在强噪声环境中(信噪比为0dB)的语音识别率达到80%以上,为信噪比较低的噪声环境中自动语音识别展现了美好前景。  相似文献   

15.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

16.
语音增强用于抗噪声语音识别   总被引:12,自引:1,他引:11  
语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能  相似文献   

17.
基于多尺度分形维数的汉语语音声韵切分   总被引:10,自引:0,他引:10  
针对低信噪比环境 ,提出一种汉语语音声韵母切分新方法。以语音信号非线性产生机制中存在混沌特性为依据 ,将普通分形维数扩展为多尺度分形维数 ,用于考察语音信号在不同最大观测分辨率下的局部自相似性。利用稳定声韵母段及其之间过渡段在多尺度分形维数上的不同特性能较好地区分二者。由此针对汉语音节“声母 +韵母”的结构特点设计了一种简单而高效的汉语语音声韵母切分方法。在干净语音测试集下测试 ,切分正确率为 95 .2 % ;在信噪比为10 d B的噪声环境下 ,正确率达到 82 .3%。  相似文献   

18.
为了提高在噪声环境下的语音识别性能,提出一种融合信号级和特征参数级抗噪的抗噪算法.该算法首先对带噪语音用最小均方误差估计法进行语音增强,后端对原始的带噪语音运用自相关法,以有效抑制加性和卷积噪声.实验结果表明,该算法能有效提高系统在噪声环境下,特别是低信噪比情况下的识别率.  相似文献   

19.
本文提出了一种新的线性预测编码(LPC)方法。它既可用于纯语音分析,也可用于噪化语音分析。用于噪化语音分析时,首先在无语音帧内估计出噪声样本的自相关系数,然后从噪化语音的自相关系中减去噪声的自相关系数,最后利用估值得到的语音自相关系数求出它的线性预测系数。当输人噪化语音的信噪比为0~10dB时,使用这种方法可以提高信噪比5dB左右。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号