首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为了进一步提高矢量Taylor级数(VTS)算法的模型补偿精度以及在噪声环境下的识别性能,提出将无监督聚类与VTS算法相结合。无监督聚类算法利用噪声模型之间的Kullback-Leibler距离将含噪语音段划分为若干个子段。然后针对各个子段分别进行一阶Taylor级数展开,并在此基础上逐段估计噪声参数和补偿声学模型。该算法结合一个中文数字串识别系统进行实验,在Babble噪声和Gauss白噪声环境下该算法的误识率相对传统的VTS算法分别下降了27.7%和17.8%。证明这种结合无监督聚类的分段VTS算法能够更加有效地将语音和噪声在倒谱域上的非线性混合模型用一阶线性模型来近似。  相似文献   

2.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

3.
矢量泰勒级数是一种有效的抗噪声鲁棒语音识别算法.然而在对数谱域,美尔滤波器组的不同通道之间有较强的相关性,因而难以从含噪语音中准确估计噪声的方差.提出了一种基于矢量泰勒级数的倒谱域特征补偿算法.该算法在倒谱域,用一个高斯混合模型描述语音倒谱特征的分布,通过矢量泰勒级数从含噪语音中估计噪声的均值和方差.实验结果表明,此算法能明显提高语音识别系统的性能,优于基于矢量泰勒级数的对数谱域特征补偿算法.  相似文献   

4.
语音增强用于抗噪声语音识别   总被引:12,自引:1,他引:11  
语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能  相似文献   

5.
应用倒谱特征的带噪语音端点检测方法   总被引:7,自引:0,他引:7  
传统的语音端点检测方法以信号的短时能量、过零率等简单特征为判决特征参数。这些方法在实际应用中,尤其当信号噪比比较低时,无法满足系统的需要。文中利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法和循环神经网络法,通过对宽带噪声-白噪声干扰情况和一种特殊噪声-汽车噪声情况的实验,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有传统的能量方法无法比拟的优越性,更适  相似文献   

6.
基于子带能量线性映射的噪声中端点检测算法   总被引:8,自引:0,他引:8  
研究噪声环境下的语音端点检测问题。在低信噪比下 ,虽然噪声和语音的频谱分布不同 ,但是传统语音检测算法使用的时域能量没有描述能量在各频域子带的分布 ,对于语音和噪声没有很好的区分性。以前提出的基于时间 -频率的能量参数利用频域的限带能量加上时域能量来进行噪声中的语音检测。但是它们选择频带的依据是语音信号的高能量子带 ,而没有考虑噪声的子带能量分布。该文提出的语音检测方法同时考虑语音和噪声的频域能量分布 ,采用线性映射的方法将 Mel滤波器组的子带能量特征空间映射到噪声和语音最有区分性的一维子空间 ,得到新的特征参数 EL MBE进行语音检测。实验结果表明 ,在噪声环境下基于线性映射的能量参数比时域能量 ,基于时间 -频率的能量有更好语音检测性能。  相似文献   

7.
基于分频段ABAP谱减法的鸟叫声分类研究   总被引:1,自引:0,他引:1  
针对带噪鸟叫声,用自适应Bartlett平均周期图(ABAP)完成噪声估计,进行分频段谱减去噪后,提取经过二维离散余弦变换的Mel频率倒谱系数动态声音特征(TDMFCC).最后,利用支持向量机(SVM)分别结合MFCC、TDMFCC以及经过分频段ABAP谱减法降噪后的MFCC和TDMFCC对30种鸟叫声进行不同背景环境和信噪比情况下的对比实验.结果表明,分频段ABAP谱减法降噪后提取TDMFCC结合SVM的方法可以取得较好的分类效果,适用于噪声环境下的鸟叫声分类.  相似文献   

8.
为了提高在噪声环境下的语音识别性能,提出一种融合信号级和特征参数级抗噪的抗噪算法.该算法首先对带噪语音用最小均方误差估计法进行语音增强,后端对原始的带噪语音运用自相关法,以有效抑制加性和卷积噪声.实验结果表明,该算法能有效提高系统在噪声环境下,特别是低信噪比情况下的识别率.  相似文献   

9.
Improved MFCC-Based Feature for Robust Speaker Identification   总被引:2,自引:0,他引:2  
The Mel-frequency cepstral coefficient (MFCC) is the most widely used feature in speech and speaker recognition. However, MFCC is very sensitive to noise interference, which tends to drastically degrade the performance of recognition systems because of the mismatches between training and testing. In this paper, the logarithmic transformation in the standard MFCC analysis is replaced by a combined function to improve the noisy sensitivity. The proposed feature extraction process is also combined with speech enhancement methods, such as spectral subtraction and median-filter to further suppress the noise. Experiments show that the proposed robust MFCC-based feature significantly reduces the recognition error rate over a wide signal-to-noise ratio range.  相似文献   

10.
在VC++环境下,提取PLAR特征参数,基于听觉特性和语谱特性的语音增强器作为预处理器,对语音信号首先进行降噪处理,建立了基于DTW的抗噪声说话人识别系统.实验结果表明,即使在信噪比比较低的情况下,该系统都会在一定程度上提高多种噪声环境下说话人识剐系统的识别性能.  相似文献   

11.
提出了一种新的噪声谱估计算法,从采集到的含噪声语音信号中直接估计出噪声谱的变化,并且利用一个初始噪声序列进行噪声谱的更新。实验表明,该算法能准确地估计出噪声谱,相比传统的噪声谱估计器,其准确性和实时性显著提高了,也增强了可靠性,特别是在有强背景噪声(输入信噪比很低)和慢变化噪声的情况下性能得到了明显的提高。  相似文献   

12.
全相位DFT抑制谱泄漏原理及其在频谱校正中的应用   总被引:2,自引:0,他引:2  
为精确估计噪声环境中的信号频率和幅值,数学证明了全相位DFT优良的抑制频谱泄漏的性质.理论分析了基于全相位DFT的双谱线法的频谱校正原理.仿真结果表明,相比于传统能量重心法,该方法的频率估计精度可获得0.01~0.001级频率分辨率的改善,并且适用于传统方法无法校正的密集频谱分布和存在强干扰频率的场合.此外,该方法的抗噪性能好.  相似文献   

13.
噪声鲁棒性问题是当前语音识别的一个重点,作者提出了一个在已有数据库下通过人为地将噪声和语音信号混合的方法,实现实际环境下的连续英文数字语音识别系统.即通过自设计的程序将采集到的噪声文本根据不同的信噪比随机地添加到现有的语音数据库的语音文本中,使新的数据库中的语音文本符合实际的语音环境.实验结果表明,本系统对带噪声环境下的英文数字的识别率效果好,单词的总体正确识别率达到95.86%.  相似文献   

14.
为了增强多带激励(MBE)声码器基音估计性能的鲁棒性,提出了一种可适用于低信噪比语音信号的改进双路径基音跟踪算法.采用全新构造的差值不等式作为约束方程,其差值门限的取值在基音跟踪过程中能够根据基音周期长短的统计特征自动更新.实验结果显示:在SNR为-5dB的高斯白噪声干扰的情况下,基音估计的严重错误概率的性能改善平均达到70%.与传统算法相比,该算法对不同讲话者和不同程度高斯白噪声干扰均具有较强的适应能力,尤其在噪声严重的情况下该算法对基音估计的准确性得到明显改善,从而使合成语音具有较好的可懂度和自然度.  相似文献   

15.
联合波束形成与谱减法的麦克风阵列语音增强算法   总被引:1,自引:0,他引:1  
考虑到封闭环境的散射噪声场中,传统波束形成方法及单通道谱减法对噪声抑制的局限性,提出一种将波束形成方法与谱减法相结合的麦克风阵列语音增强方法.该方法首先通过波束形成器的空间滤波作用,将波达方向不同的语音信号和噪声信号加以区别,再经过延时补偿单元的相应处理,从而达到衰减噪声的目的,然后采用谱减法对波束形成器输出端的残留噪声进行后置处理.仿真实验结果表明。在小房间混响情况下,与其他方法相比,该方法不仅运算量小。而且具有良好的噪声抑制性能.  相似文献   

16.
为提高实时通信中语音端点检测系统的性能,提出了一种基于能量和鉴别信息的端点检测算法。该算法利用帧信号的能量、子带信号的能量等参数,计算该帧信号与噪声帧基于子带能量分布概率的鉴别信息。算法通过利用鉴别信息,能够在包括语音帧在内的所有帧中更新噪声的能量,从而更准确地跟踪噪声能量的变化。实验结果表明:与基于能量的端点检测算法相比,该方法在信噪比变化比较剧烈的情况下仍然能够较准确地进行端点检测,在0~10 dB范围内变化的坦克噪声环境中,准确率比后者提高约24%。  相似文献   

17.
基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。  相似文献   

18.
一种基于奇异值分解的带噪语音识别方法   总被引:3,自引:3,他引:0  
提出了一种抗噪声的语音识别方法,用于训练和用于测试的语音信号在提取特征之前,均需经过相同的奇异值分解滤波,本文还提出了一种滤波参数的选取方法,实验证明,采用这种方法可以大幅度提高传统隐马尔可夫模型语音识别系统的抗噪声性能。  相似文献   

19.
一种抗噪声语音识别方法   总被引:2,自引:0,他引:2  
本文提出了一种抗噪声语音识别新方法,并以这种方法为基础,在SUN工作站上实现了这一系统,实验结果表明,本文提出的方法提高了传统隐马柯夫模型语音识别器的抗噪性能。  相似文献   

20.
提出了一种能够提高ITU-TG.729算法性能的静音检测技术,该技术的引入不仅可以降低G.729的语音通讯平均传输出特率,而且可以大量节省G.729压缩和解压过程的实际运算量,通过在不同的噪声背景下的性能分析,该静音检测技术的引入不会对G.729算法的合成语音质量产生明显的影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号