首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势.  相似文献   

2.
调制域谱减法用于鲁棒性语音识别   总被引:2,自引:2,他引:0  
针对语音识别在实际环境中缺乏稳健性的问题,提出了将调制域谱减法应用于语音识别前端的方法。先将语音信号变换到调制域,在调制域用谱减法将信号增强,在减少语音畸变的基础上提高信噪比,然后再进行识别。仿真实验表明,调制域谱减法能在较大的信噪比区间内提高系统识别率,证明此方法能显著提高语音识别系统的抗噪声能力。  相似文献   

3.
针对谱减法增强语音后残留"音乐噪声"明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法.通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声.仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果.  相似文献   

4.
针对谱减法增强语音后残留音乐噪声明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法。通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声。仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果。  相似文献   

5.
用于语音识别的减谱结合RASTA的抗噪声方法   总被引:1,自引:0,他引:1  
主要论述加性和卷积性噪声条件下语音识别的抗噪方法.在特征提取阶段,用功率谱短时均值相减的谱减方法补偿加性噪声的影响,用在Mel频标倒谱域RASTA(relative specllral)滤波补偿卷积性噪声对语音识别系统的影响.在汉语非特定人孤立数字识别实验中,使用该方法的误识率比未使用该方法要低,并且需要很小的噪声先验知识和假设,运算简单.实验证明,提出的减谱结合RASTA的方法是一种比较有效地削减噪声的方法。  相似文献   

6.
联合波束形成与谱减法的麦克风阵列语音增强算法   总被引:1,自引:0,他引:1  
考虑到封闭环境的散射噪声场中,传统波束形成方法及单通道谱减法对噪声抑制的局限性,提出一种将波束形成方法与谱减法相结合的麦克风阵列语音增强方法.该方法首先通过波束形成器的空间滤波作用,将波达方向不同的语音信号和噪声信号加以区别,再经过延时补偿单元的相应处理,从而达到衰减噪声的目的,然后采用谱减法对波束形成器输出端的残留噪声进行后置处理.仿真实验结果表明。在小房间混响情况下,与其他方法相比,该方法不仅运算量小。而且具有良好的噪声抑制性能.  相似文献   

7.
语音增强的目标是从含有噪声的语音信号中提取尽可能纯净的原始语音.在实际应用中,需要对背景噪声进行预估计,以达到改善语音质量.目前常用的语音增强方式是谱减法,但由于该算法在低信噪比环境下的效果较差,所以限制了其应用范围.该文将实时噪声估计同谱减法相结合,针对谱减法在低信噪比下效果不明显的缺点,给出一种新的语音增强方案.该方案的目的是优化传统谱减法的性能,对噪声进行更为准确的实时估计;该方案的特点就是利用谱熵对噪声进行估计,通过谱熵估计每一帧语音的噪声,再利用谱减法达到降噪的目的.实验结果表明,该方法与传统的谱减法相比,在低信噪比环境下均能得到较好的去噪效果.  相似文献   

8.
语音信息的采集过程中难免会有各种噪声的干扰,噪声降低了语音的可懂度及清晰度,甚至严重影响语音处理的准确性和可靠性。谱减法是语音减噪中最常用的方法,该方法基于人的感觉特性,对语音短时幅度谱进行估计,适用于受加性噪声污染的语音。本文通过统计分析谱减法的增益补偿因子和过减因子参数,研究基于谱减法的藏语语音减噪处理,并取得较为理想的实验结果。  相似文献   

9.
用于语音识别的基于高谱分辨率的谱减法   总被引:1,自引:0,他引:1  
提出了一种新的基于高谱分辨率的谱减法,通常噪音帧和带噪语音帧具有相同的长度且都是短时帧,对短的噪音帧和带噪语音帧做傅立叶变换得到的谱分辨率低导致谱减法性能下降严重。基于平稳或接近于平稳的背景噪音下合并所有噪音帧再做傅立叶变换以提高噪音帧的谱分辨率;通过对带噪语音信号在时域进行前向和后向的延拓再做傅立叶变换以提高带噪语音信号的谱分辨率,在有效抑制噪音的同时减少了语音谱的失真并提高了系统识别率。  相似文献   

10.
一种基于听觉掩蔽效应的语音增强方法   总被引:5,自引:1,他引:5  
为提高增强语音的听觉效果 ,研究了一种基于听觉掩蔽效应的语音增强方法。推出了一个功率谱域的基于听觉掩蔽效应的不等式准则 ,并用这个准则动态地选择一个作为语音短时谱幅度估计器的非线性函数的参数值 ,通过这个参数自适应变化的非线性函数对语音谱幅度进行估计实现语音增强。在此基础上 ,设计实现了一个单声道语音增强算法。对增强语音的客观测试和非正式听音测试表明 :相对于传统的减谱法和对数短时谱幅度最小均方误差估计增强法 ,基于听觉掩蔽效应的语音增强方法能更好地抑制背景噪声  相似文献   

11.
基于听觉模型的小波包变换的语音增强   总被引:8,自引:0,他引:8  
由于人耳频率分辨率是非线性的 ,用传统的线性信号处理方法 (如FFT)来模拟人耳基底膜的频率分析特性是比较困难的 .小波包算法有灵活的时频分析能力 ,可较好地符合人耳基底膜的频率分析特性 .在模拟人耳的听觉机理方面 ,用动态阈值法成功地对含噪语音进行了去噪处理 ,在去噪处理中引入音乐噪声的问题也较好地得到解决 .实验表明 :在单声道的条件下 ,其语音增强效果比传统的频谱减法有更高的清晰度和可懂度  相似文献   

12.
针对传统话音端点检测方法在短波低信噪比信道下检测准确率低的问题,提出一种将深度生成对抗网络和自适应参数的子带对数能熵积相结合的话音端点检测方法。该方法首先利用深度生成对抗网络话音增强方法降低噪声对待检测信号的影响,再以自适应参数的子带对数能熵积这一新的话音特征参数为阈值,使用自适应阈值双门限检测法完成话音端点检测。仿真实验结果表明,该方法对于-5 dB信噪比的标准话音库检测的平均加权错误测度仅为13.5%,而对于实际短波侦察信号库检测的平均加权错误测度为16.7%,均优于能零熵法和多窗谱估计谱减与能熵积法。  相似文献   

13.
本文提出了一种基于谱减法和经验模式分解的语音增强算法。在低信噪比的情况下用谱减法可以去除语音信号中的大部分背景噪声,再对已处理过的信号进行经验模式分解,对前几个IMF进行阈值处理可以进一步增强语音。实验表明:本算法去噪效果优于传统方法。  相似文献   

14.
语音增强是解决噪声污染的有效方法,它的首要目标是在接收端尽可能从带噪语音中恢复纯净的语音信号.讨论强背景噪声下的基于模糊系统的语音增强方法,并与减谱法语音增强算法进行比较.计算机仿真结果表明,该方法在大大消除背景噪声的同时,消除了音乐噪声,同时保持语音信号较好的可懂度.  相似文献   

15.
分形理论在语音信号端点检测及增强中的应用   总被引:7,自引:1,他引:7  
为了提高现有谱相减方法处理低信噪比语音信号的效果,利用时间序列信号的短时分形维数对低信噪比语音信号的端点检测方法进行了研究,提出了一种基于端点检测的谱相减语音增强方法,给出了其原理及具体算法.仿真实验结果表明,该方法简单可靠,有效可行,当语音信号信噪比降到-5 dB时仍然有效;与已有方法相比,具有更广泛的实用性.  相似文献   

16.
听觉掩蔽门限在说话者识别中的应用   总被引:2,自引:0,他引:2  
语音信息在人的听觉系统中的表示具有一定的冗余性.利用这一特性把丢失数据技术应用于噪声环境下说话者识别系统的性能改进.听觉掩蔽效应这一听觉现象被用来检测语音信号频谱中被噪声严重干扰的“丢失成分”.经过丢失数据补偿技术结合语音增强处理,说话者识别系统在不利环境下的准确率得到了提高.通过对宽带噪声- 白噪声和一种特殊噪声——汽车噪声干扰下语音的说话者辨认实验,发现这种方法优于单独使用语音增强方法.  相似文献   

17.
基于Matlab仿真的语音信号增强算法研究   总被引:1,自引:1,他引:0  
语音增强技术是语音信号处理的一个重要分支,也是语音识别系统的重要组成部分。简单介绍了现有的各种语音增强算法,并对目前应用最为普遍的谱相减法作了系统的描述。对传统型、增强型、改进型的谱相减法进行了探讨验证,提出了一种基于C语言环境的算法程序,详细地介绍了该程序并画出了它的算法流程图,而且进行了算法仿真,通过分析它在-5dB,0dB,5dB的信噪比下的输入输出波形,证明了该程序可以较好地实现语音增强。  相似文献   

18.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

19.
吴兰  杨攀  李斌全  王涵 《广西科学》2023,30(1):52-60
视听语音识别(Audio-Visual Speech Recognition,AVSR)技术利用唇读和语音识别(Audio-Visual Speech Recognition,AVSR)的关联性和互补性可有效提高字符识别准确率。针对唇读的识别率远低于语音识别、语音信号易受噪声破坏、现有的视听语音识别方法在大词汇量环境噪声中的识别率大幅降低等问题,本文提出一种多模态视听语音识别(Multi-modality Audio-Visual Speech Recognition,MAVSR)方法。该方法基于自注意力机制构建双流前端编码模型,引入模态控制器解决环境噪声下音频模态占据主导地位而导致的各模态识别性能不均衡问题,提高识别稳定性与鲁棒性,构建基于一维卷积的多模态特征融合网络,解决音视频数据异构问题,提升音视频模态间的关联性与互补性。与现有主流方法对比,在仅音频、仅视频、音视频融合3种任务下,该方法的识别准确率提升7.58%以上。  相似文献   

20.
近几十年来,语音识别系统已由实验室环境走向真实的世界中.在不同的环境噪声下,识别性能却仍不尽人意,尤其是在低信噪比的环境中.为解决在低信噪比情况下的低识别率的问题,以声学参数MFCC( Mel-frequen-cy cepstrum coefficient)为基础,提出了一种基于统计阈值的倒谱均值方差归一化算法,该算法...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号