首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
针对说话人识别的噪声鲁棒性问题,在对数谱最小均方差误差估计算法基础上,采用改进的最小值控制递归平均算法对语音帧信噪比进行估计,通过对前一帧的短时功率谱进行2次平滑和前向多帧最小值搜索,结合语音存在概率估计出当前帧的信噪比,并根据信噪比自适应调整增益因子的大小,对噪声进行消除。构建了一种改进的LSA语音增强方法,使用该方法可以使增强后的语音保持较高的自然度。实验结果表明,与MMSE-LSA算法比较,改进的LSA算法具有更好的语音增强效果,在5dB各类噪声环境下,其平均信噪比较MMSE-LSA算法提高1.36dB,主观语音质量评估平均提高8%。将该方法用于说话人识别系统,其检测代价较采用MMSE-LSA算法的系统平均降低3%。  相似文献   

2.
针对近讲系统的声学场景,提出一种基于听感知特性的双麦克风语音增强算法。模拟人耳频率分解特性,用gammatone滤波器组对2路麦克风采集的声音信号进行多子带频率分解;对分解后的时域信号进行分帧,生成时频单元,并计算每个时频单元的能量;以2路信号时频单元能量比值为线索,估计每个时频单元信噪比,模拟人耳掩蔽特性生成掩蔽模板,并作用于带噪声的语音信号,实现目标语音与环境噪声的分离。实验结果表明:由2路麦克风信号时频单元能量的比值可较准确估计时频单元的信噪比;该算法可提高带babble噪声命令词的识别正确率,优于当前单通道及双通道语音增强算法。  相似文献   

3.
由于噪声信号的干扰,导致机器人难以实现对微弱信号的远距离语音识别,影响最终的识别效果.为此,本文提出基于微信号增强的机器人远距离语音识别仿真研究.首先采用谱减法对微信号进行增强处理,由于语音信号中噪声功率谱具有一定的稳态属性,可估算出噪声的功率谱,再利用谱减计算求出纯净语音的功率谱,对傅里叶变换后的各个相位信号进行差异化赋权后,再对去噪功率谱进行拟合,完成对信号相位的恢复.在语音识别阶段,将增强后的原始语音信号分解为若干个独立的语音帧,在梅尔三角滤波器组中提取语音信号的Mel频谱参数,将其与语音频率之间的关系作为识别特征参数,最后利用梯度下降算法,在损失函数的约束下匹配与识别特征拟合度最高的内容,实现语音识别.仿真测试结果表明,本文提出的设计方法在噪声、不同信噪比、不同测试距离下对语音的识别率均达到了95.00%以上,与对照组相比具有更好的识别效果.  相似文献   

4.
提出了一种基于SDCN算法的鲁棒性语音命令识别。依赖于信噪比的倒谱正常化(SDCN)算法直接在倒谱域根据输入语音帧的信噪比(SNR)来增加一补偿矢量,从而恢复未受污染的净语音信号,补偿矢量直接从训练环境和测试环境中记录的语音倒谱中逐帧比较得到,该算法对退化的环境具有很强的鲁棒性,实验结果证明,该算法简单,有效。  相似文献   

5.
融合语音增强与后续补偿的抗噪声语音识别方法   总被引:2,自引:1,他引:2  
为了提高基于隐含Markov模型的语音识别系统在噪声环境中的稳健性,研究了一种融合语音增强与后续补偿的抗噪声语音识别方法.在前端,语音增强有效地抑制背景噪声,从而提高了输入信号的信噪比.语音增强后的剩余噪声以及语音失真是对语音识别不利的因素,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿.实验结果表明,此方法能够显著地提高语音识别系统在噪声环境中,特别是低信噪比条件下的识别精度,如对-5 dB的自噪声,该方法可将识别精度从11.7%提高至71.0%.  相似文献   

6.
为提高低信噪比下语音端点检测的准确性,提出了一种基于模糊熵与改进相关向量机的端点检测算法.首先对语音信号进行基于听觉感知特性的语音增强,然后提取每帧信号的模糊熵作为改进相关向量机的输入矢量,同时针对单一核函数对预测分类鲁棒性弱的问题,对不同核函数进行自适应多核组合,融合多个核函数的特性,提高分类精度和鲁棒性.实验结果表明:在低信噪比环境下,基于模糊熵与改进相关向量机的端点检测能更有效地检测出语音的端点,准确率达到93.2%.  相似文献   

7.
一种新型语音识别系统   总被引:1,自引:0,他引:1  
提出一种新型语音识别系统,采用帧能量与帧过零率的乘积作为指标量进行语音端点检测,以MFCC作为语音信号特征矢量,基于HMM语音识别模型进行语音识别.同时,提出了一种新的抗噪语音识别方法,通过改进型重复Wiener滤波结合PUM模型进行抗噪语音识别,较好地抑制了噪声干扰,提高了语音识别率.  相似文献   

8.
随着自动驾驶汽车研究的不断深入,对其环境感知系统提出了更高的要求。为了使自动驾驶汽车适应更复杂的交通环境,本文研究了低信噪比声学环境感知技术,提出改进的小波包去噪方法;采用经验模态分解(EMD)的方法改进梅尔频率倒谱系数(MFCC)的提取;采用支持向量机(SVM)识别模型完成低信噪比交通环境声音识别。实验结果表明,本文提取的去噪方法提高声音事件信噪比的同时保持声音特征,且对噪声有自适应性;改进的MFCC提取方法一定程度上提高了特征参数的抗噪性能。通过对低信噪比交通环境声音去噪和特征参数优化后,其平均识别率比优化前提高了33.34%,并改变了识别率骤降的趋势。  相似文献   

9.
语音端点检测是语音识别中非常重要的部分,识别率高低很大程度上取决于端点检测的精确程度。在高信噪比(signal-noise ratio,SNR)的实验室环境下,端点检测有很好的效果;但比如像工厂和市场等低SNR环境下,传统的检测方法性能迅速降低,端点检测无法达到预期效果。针对低SNR语音的端点检测,先通过谱减法对带噪语音进行降噪,再分别求出每帧语音信号的能量与频带方差的乘积,将乘积值作为参数进行双门限端点检测的思路,提出了一种能量和频带方差结合的端点检测方法。将TIMIT数据集中语音叠加高斯随机噪声、NOISEX 92噪声库中的factory噪声和volvo噪声进行实验。结果表明,当SNR在-10 d B时,仍有较好的检测效果,显著提高了语音端点检测的效果。  相似文献   

10.
研究了帧长、帧移、信噪比、窗函数和语速对汉语音段反转言语掩蔽效率的影响.采用不同参数对目标语音进行处理,得到音段反转言语,其掩蔽效率由被掩蔽声的可懂度衡量,被掩蔽声的可懂度由语音质量感知评估(PESQ)指标评价得到.研究表明,汉语音段反转言语的掩蔽效率随帧长的增加、信噪比的降低或语速的升高而升高,帧移为帧长的1/2时掩蔽效率最高,窗函数对掩蔽效率没有影响.  相似文献   

11.
为降低噪声对语音通信的干扰,提出了一种基于谱减的语音增强算法的改进方法。根据噪声频谱的G auss统计模型修正语音增强过程中噪声频谱的估计方法,利用帧内、帧间约束估计每一个频点的先验信噪比,提出了一种简便的估计语音在每一个频点出现的概率的方法,得出了修正的语音增强算法。在白噪声以及坦克噪声环境中分别对算法的性能进行测试。实验结果表明:在几乎不损伤语音清晰度的前提下,该算法使“音乐噪声”得到了更好的抑制,同时信噪比提高了约8 dB以上。  相似文献   

12.
基于短时能零积和鉴别信息的语音端点检测   总被引:1,自引:0,他引:1  
为了提高低信噪比下语音端点检测的准确率,提出了一种新型的语音端点检测算法.该算法利用短时能零积法和鉴别信息的互补优势,一边降噪一边端点检测,而且对于被判为噪声的帧利用基于子带能量鉴别信息方法来进行二次复检,根据鉴别信息来更新噪声能量门限,从而能更准确地跟踪噪声的能量变化.实验结果表明,该方法在信噪比变化比较剧烈的情况下仍然能够准确地进行端点检测,对语音信号的后续处理起到了很好的作用.  相似文献   

13.
调制域谱减法用于鲁棒性语音识别   总被引:2,自引:2,他引:0  
针对语音识别在实际环境中缺乏稳健性的问题,提出了将调制域谱减法应用于语音识别前端的方法。先将语音信号变换到调制域,在调制域用谱减法将信号增强,在减少语音畸变的基础上提高信噪比,然后再进行识别。仿真实验表明,调制域谱减法能在较大的信噪比区间内提高系统识别率,证明此方法能显著提高语音识别系统的抗噪声能力。  相似文献   

14.
低信噪比下基于谱熵的语音端点检测算法   总被引:14,自引:0,他引:14  
为提高语音端点检测系统在低信噪(0 dB以下)下检测的准确率,提出了一种基于谱熵的端点检测算法。将每帧信号分为16个子带,选取频谱分布在250~3.5 kH z并且能量不超过该帧总能量90%的子带,计算经过语音增强后的子带能量以及各子带信噪比,根据各子带信噪比的不同调整其在整个谱熵计算过程中的权重,然后平滑谱熵,以最终的谱熵作为端点检测的依据。实验结果表明,此方法在较低的信噪比下能够显著地提高端点检测的准确率。对坦克噪声,检测效果明显优于G.729中的端点检测算法,即使在-5 dB的信噪比下,仍然可以达到95%以上的检测率。  相似文献   

15.
用于语音识别的基于高谱分辨率的谱减法   总被引:1,自引:0,他引:1  
提出了一种新的基于高谱分辨率的谱减法,通常噪音帧和带噪语音帧具有相同的长度且都是短时帧,对短的噪音帧和带噪语音帧做傅立叶变换得到的谱分辨率低导致谱减法性能下降严重。基于平稳或接近于平稳的背景噪音下合并所有噪音帧再做傅立叶变换以提高噪音帧的谱分辨率;通过对带噪语音信号在时域进行前向和后向的延拓再做傅立叶变换以提高带噪语音信号的谱分辨率,在有效抑制噪音的同时减少了语音谱的失真并提高了系统识别率。  相似文献   

16.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

17.
基于语音识别的说话人身份辨识系统   总被引:2,自引:0,他引:2  
提出一种在小字库孤立语音条件下,集成语音识别与说话人的识别技术,并进行说话人身份代码(密码)识别、认证.利用语音信号的短时分析技术进行孤立词的单元分割,采用临界带特征矢量作为语音信号特征,分析了经典语音识别算法——动态时间规整算法,提出了对语音模板各帧加权的改进方法.为提高识别响应速度,研究了多门限多轮次的判决方法,在增加多套模板、提高识别率的情况下,降低了系统的响应时间.  相似文献   

18.
针对声发射技术在旋转机械故障检测中的强噪声干扰问题,提出了一种基于小波熵的声发射检测算法.该算法首先给定一个合理的阈值.对声发射信号进行小波分解.然后进行分帧处理,使信号在较短的时间间隔内保持特性基本不变,从而求出每一帧信号的小波熵.通过比较每一帧信号的小波熵值与阈值的大小,判断该信号为声发射帧还是噪声帧.为了检验算法的检测效果,在转子实验台上获得碰摩声发射信号.并在测试数据上叠加不同信噪比的高斯白噪声和非平稳噪声,进行声发射识别.实验结果表明:该算法具有较高的识别正确率;在低信噪比环境下,通过调整阈值的可调参数可以有效提高识别的正确率.  相似文献   

19.
端点检测是语音信号处理的过程中非常重要的一个环节,其准确性直接影响语音信号处理的速度和结果.特别是在实际应用中因信噪比较低,使得某些高信噪比下性能好的端点检测算法准确率也比较低.为了提高在低信噪比的环境下佤语语音端点检测的准确率,本文使用了一种基于多窗谱估计谱减法和能熵比法的语音端点检测复合算法.该算法首先利用多窗谱估计谱减法去除语音的背景噪音以提高信噪比;其次再对去噪后的语音使用能熵比算法进行端点检测;最后借助Matlab工具对佤语语音进行仿真实验.仿真结果表明:对于低信噪比的环境下的佤语语音,本文使用的基于多窗谱估计谱减法和能熵比法复合算法同常规能熵比算法相比,端点检测的准确率提高了34%.  相似文献   

20.
为了提高在噪声环境下的语音识别性能,提出一种融合信号级和特征参数级抗噪的抗噪算法.该算法首先对带噪语音用最小均方误差估计法进行语音增强,后端对原始的带噪语音运用自相关法,以有效抑制加性和卷积噪声.实验结果表明,该算法能有效提高系统在噪声环境下,特别是低信噪比情况下的识别率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号