首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
语音增强用于抗噪声语音识别   总被引:12,自引:1,他引:11  
语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能  相似文献   

2.
针对噪声和混响情况下的语音增强问题,本文给出一种基于子带独立分量分析(ICA-R)算法和收缩函数后处理的语音增强方法.该方法将ICA-R和收缩函数算法相结合,在噪声和混响环境中通过对两路带噪语音信号进行增强处理,以实现增强目标语音信号的目的.首先对两路带噪语音信号进行子带分解;然后在子带内利用ICA-R算法从带噪语音信号中提取出子带目标信号,再经过综合滤波器形成全带目标信号;最后,将该信号经收缩函数后处理,得到增强后的目标语音信号.用实际录制的带噪语音信号对本文方法进行了测试,实验结果表明,该方法具有较强的噪声抑制能力,对语音信号造成的损伤较小.  相似文献   

3.
为了在保证语音增强算法性能的同时,降低算法复杂度,提出了一种巴克域最小统计量控制递归平均噪声估计算法.将带噪信号在巴克域进行分解并进行最小统计量分析,基于此最小统计量控制噪声的递归平均估计.算法基于听觉模型,充分利用巴克带内频带间的相关性,具有较好的噪声跟踪估计性能.该算法复杂度低,适用于常见语音增强方法.仿真结果表明,基于该噪声估计的语音增强可以有效地抑制噪声,增强后语音失真较小,在低信噪比条件下能够有效改善语音编码合成后的语音质量.  相似文献   

4.
通过子带Wiener滤波结合PUM(Probabilistic Union Model)模型,实现在噪声环境下连续字语音识别的方法。该方法先通过对语音信号进行子带Wiener滤波预处理消除已知噪声,为PUM模型提供只有局部被噪声污染的语音信号,再利用PUM模型进行抗噪语音识别。试验表明在各种不同的噪声环境下,该新方法有更高的平均识别率。  相似文献   

5.
传统的端点检测在信噪比较高的环境下可以有效的对语音进行端点检测,但是在低信噪比环境下端点检测的正确率急剧下降。针对在低信噪比环境下语音端点检测正确率不高的问题,提出一种将调制域谱减法和对数能量子带谱熵相结合的的端点检测算法。该算法首先利用调制域谱减法去除带噪语音的噪声以提高语音信号的信噪比,然后结合对数能量和子带谱熵算法对消噪后的语音信号进行端点检测。实验仿真结果表明,该算法在低信噪比环境下能有效提高语音端点检测的正确率且具有一定的稳健性。  相似文献   

6.
为提高卷积环境下语音识别系统的鲁棒性,提出了一种基于时/频ICA(independent component analysis)的卷积噪声模型估计方法.所提算法首先使用ICA方法从含噪语音信号中提取纯净语音信号的短时功率谱,然后在MEL滤波器组域内将含噪语音的短时谱减去纯净语音的短时谱,并根据去噪后卷积噪声的短时谱估算其HMM(hidden markov model)模型.在仿真和真实环境下进行了语音识别实验,其识别正确率相比较传统的卷积噪声估计方法分别提升了4.70%和4.75%.实验结果表明,论文所提算法能够实现对卷积噪声的精确估计,并有效提升卷积噪声环境下语音识别系统的性能.  相似文献   

7.
传统的端点检测在信噪比较高的环境下可以有效地对语音进行端点检测,但是在低信噪比环境下端点检测的正确率急剧下降。针对在低信噪比环境下语音端点检测正确率不高的问题,提出一种将调制域谱减法和对数能量子带谱熵相结合的的端点检测算法;该算法首先利用调制域谱减法去除带噪语音的噪声以提高语音信号的信噪比,然后结合对数能量和子带谱熵算法对消噪后的语音信号进行端点检测。实验仿真结果表明,该算法在低信噪比环境下能有效提高语音端点检测的正确率且具有一定的稳健性。  相似文献   

8.
针对噪声环境下语音识别系统性能下降的问题,提出一种基于语音时频相关性的Mel特征矢量聚类补偿算法。该算法首先实现掩码估计,利用纯净语音信号时域和频域的相关性,实现了时频块的有效划分和基于时频块的语音特征聚类。在此基础上,对带噪语音的Mel语谱进行特征补偿。采用HTK工具和TIDIGITS数据库加入不同类别噪声的语音测试结果表明:该算法在不同信噪比条件下,获得了较基于频域相关性聚类特征补偿算法更好的性能。  相似文献   

9.
一种改进的基于子带谱熵的语音激活检测方法   总被引:2,自引:2,他引:0  
语音信号的激活检测(voice activity detection,VAD)是变速率语音编码的关键技术,用来检测通信时是否有语音片存在.在有噪环境下对语音信号的激活检测是非常重要而困难的.对传统子带谱熵算法进行了改进,提出了一种能够用于语音激活检测的新算法.该算法利用语音谱熵和噪声谱熵分布的不同,将信号的数字特征(方差、均值等)与传统子带谱熵相结合,用于区分语音段和非语音段.计算机仿真结果表明,在高斯白噪声环境下,改进后的子带谱熵算法能很好地区分说话人的语音段和非语音段,在某种程度上解决了传统语音激活检测算法结构复杂、参数难调、易受噪声影响等问题.  相似文献   

10.
语音信号在传输过程中常常受到传输系统或周围环境的噪声影响而无法识别说话者的内容。为了尽可能消除语音中的噪声,提高语音的信噪比及清晰度,提出了一种基于奇异值分解的希尔伯特黄消噪算法。该算法对带噪语音信号进行经验模态分解,得到各阶固有模态函数,在对各阶固有模态函数分量分析的基础上,利用软阈值和奇异值算法相结合的方法来达到语音消噪的目的。这种分阶消噪算法可以尽可能的除去噪声,提取出纯净的语音信号。通过大量的仿真结果可以证明:该算法在语音消噪应用具有可行性,而且优于传统语音消噪方法。  相似文献   

11.
为提高电子耳蜗植入者在噪声下的语音识别能力,提出了一种利用频率调制信息的算法。该算法根据人耳听觉机理,增加了频带选择法则。该法则对不同频带提取出的频率调制信息进行了有选择的传递,并在听觉仿真试验中得到验证:该算法既可以比传统幅度信息编码算法更有效地提高电子耳蜗植入者在噪声下的语音识别能力,又降低了不选择频带而全通道传递频率调制信息算法的复杂度(频率调制信息提取的计算量降低了37.5%),减少了内存占用,使之适合在临床上实时实现。  相似文献   

12.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

13.
基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。  相似文献   

14.
语音端点检测(voice activity detection,VAD)是在连续语音信号中,将语音和非语言片段分离的技术。VAD在语音识别、说话人识别、语音编码等领域起着重要作用。传统VAD算法在类型已知的噪声环境下可以达到较好的性能,但在实际情况中,未知噪声的影响通常会使系统性能下降显著,在差异化噪声下的VAD是端点检测的研究难点。在总结现有语音端点检测算法基础上,提出了一种基于深度神经网络的语音端点检测方法,同时结合维特比算法,与基于贝叶斯信息准则(bayesian information criterion, BIC)的混合高斯模型(gaussian mixture model,GMM) 语音端点检测系统进行对比,在大词汇连续语音识别系统中的实验结果表明,将深度神经网络结合维特比算法,应用于语音端点检测,在复杂噪声环境下取得了更好的效果,适应性更强。  相似文献   

15.
Based on the results of the acoustic research on Mandarin, two novel algorithms using the spectral information in speech processing of cochlear implants are purposed and certified effectively by the spectral information of tonal language in acoustic simulation experiments. We bring forward novel algorithms conveying the spectral information based on the choices of the frequency bands. These new algorithms can not only improve the speech recognition ability of cochlear implant users in the noisy environments but also reduce the complexity of computing and the memory occupied, and make it more suitable to be carried out in clinical practice.  相似文献   

16.
Based on the results of the acoustic research on Mandarin, two novel algorithms using the spectral information in speech processing of cochlear implants are purposed and certified effectively by the spectral information of tonal language in acoustic simulation experiments. We bring forward novel algorithms conveying the spectral information based on the choices of the frequency bands. These new algorithms can not only improve the speech recognition ability of cochlear implant users in the noisy environments but also reduce the complexity of computing and the memory occupied, and make it more suitable to be carried out in clinical practice.  相似文献   

17.
用于语音识别的基于高谱分辨率的谱减法   总被引:1,自引:0,他引:1  
提出了一种新的基于高谱分辨率的谱减法,通常噪音帧和带噪语音帧具有相同的长度且都是短时帧,对短的噪音帧和带噪语音帧做傅立叶变换得到的谱分辨率低导致谱减法性能下降严重。基于平稳或接近于平稳的背景噪音下合并所有噪音帧再做傅立叶变换以提高噪音帧的谱分辨率;通过对带噪语音信号在时域进行前向和后向的延拓再做傅立叶变换以提高带噪语音信号的谱分辨率,在有效抑制噪音的同时减少了语音谱的失真并提高了系统识别率。  相似文献   

18.
用于语音识别的鲁棒自适应麦克风阵列算法   总被引:1,自引:0,他引:1  
对现实环境中存在的混响以及非平稳干扰语音信源等因素导致的算法性能下降,提出了一种用于语音识别的鲁棒旁瓣对消算法。讨论了旁瓣对消算法在自适应麦克风阵列中的应用,分析了算法在不同的混响条件下、不同的干扰源的噪声抑制能力。该算法通过分帧处理将输入信号划分为一系列短时平稳的信号片段。根据当前帧的信噪比决定自适应滤波器的权系数更新方式。采用一定的范数约束来限制自适应滤波器权系数的误调整。实验结果表明该麦克风阵列在混响的现实环境中能够有效抑制平稳噪声源和交叠谈话背景干扰,提高了语音识别器的抗噪性能。  相似文献   

19.
噪声环境中基于HMM模型的语音信号端点检测方法   总被引:7,自引:1,他引:6  
在噪声环境下如何提高语音信号端点检测的准确性是自动语音识别(ASR)研究中的一个重要课题.常用的基于短时能量的端点检测方法对于能量较低的音节或在信噪比较低的环境下,检测性能不够理想.讨论了一种基于HMM模型的语音信号端点检测方法.先用训练的方法生成背景噪声和废料的模型,再用Viterbi解码算法对待测信号进行处理,并给出了具体的实现方法.实验测试结果表明,基于HMM的端点检测方法的检测性能接近于人工检测,方法是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号