首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为了提高在噪声环境下的语音识别性能,提出一种融合信号级和特征参数级抗噪的抗噪算法.该算法首先对带噪语音用最小均方误差估计法进行语音增强,后端对原始的带噪语音运用自相关法,以有效抑制加性和卷积噪声.实验结果表明,该算法能有效提高系统在噪声环境下,特别是低信噪比情况下的识别率.  相似文献   

2.
一种基于听觉模型的抗噪语音识别特征提取方法   总被引:5,自引:2,他引:5  
提出了一种新的语音识别特征提取方法。该方法是建立在听觉模型的基础上,通过计算语音的上升过零率作为频率信息并通过非线性幅度加权相结合来获取语音特征。仿真实现了中小词汇量、孤立词的语音识别,得到了较好的实验结果,证明了此方法具有较强的抗噪声性能。  相似文献   

3.
矢量泰勒级数是一种有效的抗噪声鲁棒语音识别算法.然而在对数谱域,美尔滤波器组的不同通道之间有较强的相关性,因而难以从含噪语音中准确估计噪声的方差.提出了一种基于矢量泰勒级数的倒谱域特征补偿算法.该算法在倒谱域,用一个高斯混合模型描述语音倒谱特征的分布,通过矢量泰勒级数从含噪语音中估计噪声的均值和方差.实验结果表明,此算法能明显提高语音识别系统的性能,优于基于矢量泰勒级数的对数谱域特征补偿算法.  相似文献   

4.
基于FSS与PLP的噪声鲁棒语音识别   总被引:1,自引:0,他引:1  
提出了一种基于分数阶谱相减(FSS)与感知线性预测(PLP)相结合的噪声鲁棒语音识别方法,记为FSS PLPC.该方法首先通过FSS在分数阶Fourier域对带噪语音进行降噪处理,然后计算增强语音的均方误差和Itakura距离并进行比较,以获得FSS的近似最优分数阶阶数.最后对根据此阶数得到的增强语音提取感知线性预测倒谱(PLPC).实验结果表明,FSS PLPC对于数字语音的识别性能优于传统的谱减法(SS PLPC)和感知线性预测倒谱(PLPC)法,并且随着信噪比的降低FSS PLPC表现出较好的噪声鲁棒性.  相似文献   

5.
汽车噪声中自动语音的识别技术   总被引:6,自引:0,他引:6  
汽车中的话音拨号系统是自动语音识别技术的应用热点.自动语音识别系统是一个基于训练的系统.在汽车噪声中,由于实际应用环境与形成系统参数的训练环境的失配,传统语音识别系统的性能会大幅度地下降,从而无法实用.为了提高语音识别系统在特定环境下的识别率及实用性,首先根据汽车环境中语音的失真模型分析了系统性能下降的原因,然后针对加性汽车噪声与信道失真对系统的影响,讨论了在汽车噪声中改善语音识别系统性能的方法.提出了在识别系统中用基于子带的语音增强算法和倒谱均值相减算法相结合的方法.对大量的多人连续数字串语音的识别实验表明,这一方法大大提高了系统在汽车噪声环境中的识别率,它还可以简便、实时的实现,具有一定的实用性.  相似文献   

6.
为改善语音识别系统的性能,采用时频分布参数来描述语音特征。由于时频分布参数考虑到语音信号内在的非平稳特性,因此能够更准确地描述语音信号的时频特性。对基于正弦模型的多种时频参数(能量谱和幅度加权瞬时频谱)进行了比较,并在基于隐马尔可夫模型的连接词语音识别系统中进行了实验仿真。结果表明,单独采用时频分布参数作为ASR的前端特征并不能改善识别率;而采用标准ASR特征和能量谱时频特征的联合前端特征,可以有效地改善语音识别系统的识别效果。  相似文献   

7.
针对归一化方法在连续语音特征曲线调整时存在的问题, 提出一种优化解决方案, 解决了噪声的不稳定性及不可预测性对语音特征的影响. 结果表明, 基于该优化方法建立的鲁棒性连续语音识别模型可实现在实验室干净环境和现实噪音环境下同时得到较好的识别结果.  相似文献   

8.
IntroductionIn recentyears,speech recognition has made greatprogress.Commercial systems such as Via Voice( IBM Company) and Naturally Speaking 1 .0( Dragon System Company ) lead the field.Although the recognition ratio has greatlyimproved,many issues still need further research,such as,real- time in processing,systemcomplexity[4 6] ,very large scale integrated circuit( VLSI) implementation,etc.Among these issues,the implementation in VLSI is the most criticalchallenge for wide use of s…  相似文献   

9.
将神经网络预测模型(NPM)应用于说话人识别中,经过实验,获得了较满意的结果。这说明神经网络对于说话人识别是一种很有潜力的方法。  相似文献   

10.
基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。  相似文献   

11.
基于听觉模型的小波包变换的语音增强   总被引:8,自引:0,他引:8  
由于人耳频率分辨率是非线性的 ,用传统的线性信号处理方法 (如FFT)来模拟人耳基底膜的频率分析特性是比较困难的 .小波包算法有灵活的时频分析能力 ,可较好地符合人耳基底膜的频率分析特性 .在模拟人耳的听觉机理方面 ,用动态阈值法成功地对含噪语音进行了去噪处理 ,在去噪处理中引入音乐噪声的问题也较好地得到解决 .实验表明 :在单声道的条件下 ,其语音增强效果比传统的频谱减法有更高的清晰度和可懂度  相似文献   

12.
介绍了语音识别技术ASR的发展历史、目前研究方法、技术手段及当前取得的成绩与不足,提出一种新的的研究理论——利用基因算法训练HMM方法.  相似文献   

13.
语音识别中HMM与自组织神经网络结合的混合模型   总被引:9,自引:0,他引:9  
基于隐马尔可夫模型和自组织神经网络模型提出了一种用于语音识别的混合模型,给出了训练调整权向量的算法,实验结果表明其在语音识别中具有很好的性能·  相似文献   

14.
用于SOM神经网络语音识别的自适应局部搜索算法   总被引:1,自引:0,他引:1  
采用一种基于自组织特征映射(SOM)神经网络和隐马尔柯夫模型(HMM)法结合的语音识别方法.根据语音信号的相关性,提出了一种自适应局部搜索算法.结果表明,该算法相对于全搜索算法而言,计算量小而又不降低识别率  相似文献   

15.
谐波小波样本熵与HMM模型的轴承故障模式识别   总被引:1,自引:0,他引:1  
根据谐波小波分解非平稳振动信号优良特性与隐马尔科夫(HMM)模型的时序模式分类能力,提出了一种基于谐波小波样本熵与HMM模型结合的轴承故障模式识别方法.该方法首先利用谐波小波对轴承各个状态故障信号进行分解,进而由谐波小波三维时频网格图的频率层数特征计算合理的样本熵维数和阈值,依次提取轴承振动信号各层的样本熵构成特征向量序列;然后将序列前120组输入HMM模型中进行训练得到对应故障模型,剩余80组进行测试与识别,通过对比对数似然估计概率输出值确定轴承故障类型.实验通过与BP和RBF神经网络模型进行不同训练组数的正确识别率对比,验证了该组合方法具有识别准确率高,稳定性强的优点.  相似文献   

16.
提出了一种基于小波变换和HMM模型的ARMA新模型参数,并将它用于A…N的英文字母的识别。小波变换可以高频提供高的频率分辨,在低频提供高的时间分辨率,而ARMA模型则可以改善LPC模型中没有零点的不足。实验结果表明,2个零点,10个极点的ARMA对字母C的识别准确性明显提高。  相似文献   

17.
把小波理论应用于抗噪语音识别特征提取,提出了基于高斯小波滤波器的语音识别特征提取方法,通过对人耳听觉特性的研究,按照人耳临界带宽设计了一组高斯小波带通滤波器。详细讨论了高斯小波滤波器的尺度参数选择方法。使用RBF识别网络,仿真实现了使用新特征与原特征的识别结果,证明了新特征具有较高的识别率和优良的抗噪性能。  相似文献   

18.
基于人耳听觉特性提出一种新的抗噪音识别特征:加权组合过零峰值幅度特征,是对过零峰值幅度特征的一种改进。加权组合过零峰值幅度特征以语音数据和差分语音数据作为处理对象,通过计算它们的上升过零率获得频率信息,经幅度非线性压缩获得密度信息,并根据人耳对声音的感知特点对其进行加权,形成最终的输出特征,识别网络使用HMM。仿真实现了使用新特征与原特征的算法识别结果,证明了新特征具有较高的识别率和优良的抗噪性能。  相似文献   

19.
一种抗噪声语音识别方法   总被引:2,自引:0,他引:2  
本文提出了一种抗噪声语音识别新方法,并以这种方法为基础,在SUN工作站上实现了这一系统,实验结果表明,本文提出的方法提高了传统隐马柯夫模型语音识别器的抗噪性能。  相似文献   

20.
董蓉  袁俊  朱杰 《上海交通大学学报》2002,36(10):1529-1532
在普通话连续数字串的识别中,与传统HMM在持续时间模型上的错误假设有关的删除与插入错误所占比例可达24.23%。基于此,在Viterbi解码中引入持续时间模型信息。对多种带参函数分布的持续时间模型在理论和实验上的比较分析都证明了Gamma分布更能精确反映汉语字模型的持续时间特性。文中还在外惩罚模型的基础上提出预理分段内惩罚持续时间模型和全局内惩罚持续时间模型两种改进算法。实验表明,结合持续时间模型的语音识别算法可以有效地减少删除与插入错误率,使总体识别错误率比基带系统减少了47.74%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号