首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 766 毫秒
1.
单通道语音增强中,已有的先验信噪比算法能有效地去除噪声,提升语音增强算法性能;但是由于在噪声功率谱估计不准确,造成噪声功率出现过估和低估的情况,造成了语音失真和保留较多残留噪声。通过倒谱处理能在含噪语音段中抑制语音中的谐频成分和在纯噪声段中避免部分较强的噪声成分误判为语音信号,准确地估计出噪声功率谱,同时语音失真不大。在多种噪声背景下的客观评价指标分析表明,经过倒谱处理后的先验信噪比估计算法能提高先验信噪比算法的估计性能。  相似文献   

2.
基于谱增益迭代的先验信噪比估计语音增强算法   总被引:1,自引:0,他引:1  
结合经典的谱增益算法和迭代算法,提出了一种基于谱增益迭代的先验信噪比估计语音增强算法.也就是通过谱增益的循环迭代,实现纯净语音信号估计逐步逼近真正的纯净语音,然后根据先验信噪比定义更新先验信噪比的估计值,反过来,又更新了谱增益值,从而实现噪声消除.同时这种方法解决了基于直接判据算法,先验信噪比估计值比后验信噪比估计值延迟一帧的问题,从而有效地消除"音乐噪声".试验表明,这种算法能够有效地消除噪声.  相似文献   

3.
先验信噪比估计精度直接影响着语音增强算法的性能.本文对3种不同的先验信噪比估计算法:经典的直接判决算法、两步噪声消除算法和改进型直接判决算法的优缺点进行了理论分析和实验验证.实验部分包括:语谱、输出先验信噪比跟踪曲线、不同背景噪声下的输出对数似然比图像、不同背景噪声下输出的分段信噪比图像和不同噪声下输出的短时客观可懂度图像.此外,分析了直接判决算法的平滑因子的取值对音乐噪声和语音失真的影响.  相似文献   

4.
基于递归最小追踪的噪声互功率谱估计算法   总被引:1,自引:1,他引:0  
针对改进最小追踪噪声互功率谱估计方法存在的噪声过估计的问题。提出一种基于递归最小追踪的噪声互功率谱估计算法。该方法中的平滑因子使用了递归平均技术,在估计噪声互功率谱时,会根据每个频点的实际信噪比作相应的调整。仿真结果表明,该噪声估计算法应用于一个语音增强系统时,取得了较小的噪声均方估计误差及较好的感知语音质量评价(PESQ)得分。  相似文献   

5.
针对基本谱减法的噪声残留以及损伤语音的可懂度和自然度等问题,在基本谱减法原理基础上,提出了基于参数自适应的改进谱减法。引进谱减功率系数和谱减噪声系数,以增强后语音信号的信噪比为输出,以变化的谱减功率系数和谱减噪声系数为输入,自动控制选择最优参数,并且将其与带噪语音输入信噪比相匹配。对信号进行语音增强时,通过计算其输入信噪比,利用最优参数曲线得到最优参数值,然后结合平滑处理的过程实现语音增强最大化。实验表明,本文算法有效提高了基本谱减法的语音增强性能。  相似文献   

6.
针对谱减法增强语音后残留"音乐噪声"明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法.通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声.仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果.  相似文献   

7.
针对说话人识别的噪声鲁棒性问题,在对数谱最小均方差误差估计算法基础上,采用改进的最小值控制递归平均算法对语音帧信噪比进行估计,通过对前一帧的短时功率谱进行2次平滑和前向多帧最小值搜索,结合语音存在概率估计出当前帧的信噪比,并根据信噪比自适应调整增益因子的大小,对噪声进行消除。构建了一种改进的LSA语音增强方法,使用该方法可以使增强后的语音保持较高的自然度。实验结果表明,与MMSE-LSA算法比较,改进的LSA算法具有更好的语音增强效果,在5dB各类噪声环境下,其平均信噪比较MMSE-LSA算法提高1.36dB,主观语音质量评估平均提高8%。将该方法用于说话人识别系统,其检测代价较采用MMSE-LSA算法的系统平均降低3%。  相似文献   

8.
为了改进噪声环境下的语音增强效果,充分抑制背景噪声,有效消除残留“音乐噪声”,本文通过MATLAB仿真测试,对目前广泛使用的功率谱减法、维纳滤波器、最大似然短时谱幅度(STSA)估计以及最小均方误差STSA估计等语音增强算法进行了性能比较,在深入理解最大似然STSA估计算法的基础上,提出了一种针对实时应用的改进型短时谱幅度(MSTSA)估计器,实验结果显示本文提出的语音增强算法物理意义明确,复杂度较低,在低信噪比情况下能有效抑制背景噪声,在高信噪比时又能减小语音的畸变.同时,本文还提出了一种新的先验信噪  相似文献   

9.
针对谱减法增强语音后残留音乐噪声明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法。通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声。仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果。  相似文献   

10.
针对语音激活检测的鲁棒性问题,提出在非平稳噪声环境下使用基于复高斯混合模型的鲁棒语音激活检测算法.算法中假设纯净语音谱满足复高斯混合模型,先验信噪比利用预先训练好的复高斯混合模型计算得到.复高斯混合模型的引入一方面提高了语音激活检测的性能,另一方面避免了使用基于最小均方误差语音增强的先验信噪比估计过程.实验中使用NOISEX-92噪声库来验证系统在噪声环境下的性能.结果表明,该种算法在非平稳噪声环境下具有良好的检测性能.  相似文献   

11.
语音增强的目标是从含有噪声的语音信号中提取尽可能纯净的原始语音.在实际应用中,需要对背景噪声进行预估计,以达到改善语音质量.目前常用的语音增强方式是谱减法,但由于该算法在低信噪比环境下的效果较差,所以限制了其应用范围.该文将实时噪声估计同谱减法相结合,针对谱减法在低信噪比下效果不明显的缺点,给出一种新的语音增强方案.该方案的目的是优化传统谱减法的性能,对噪声进行更为准确的实时估计;该方案的特点就是利用谱熵对噪声进行估计,通过谱熵估计每一帧语音的噪声,再利用谱减法达到降噪的目的.实验结果表明,该方法与传统的谱减法相比,在低信噪比环境下均能得到较好的去噪效果.  相似文献   

12.
调制域谱减法用于鲁棒性语音识别   总被引:2,自引:2,他引:0  
针对语音识别在实际环境中缺乏稳健性的问题,提出了将调制域谱减法应用于语音识别前端的方法。先将语音信号变换到调制域,在调制域用谱减法将信号增强,在减少语音畸变的基础上提高信噪比,然后再进行识别。仿真实验表明,调制域谱减法能在较大的信噪比区间内提高系统识别率,证明此方法能显著提高语音识别系统的抗噪声能力。  相似文献   

13.
基于听觉模型的小波包变换的语音增强   总被引:8,自引:0,他引:8  
由于人耳频率分辨率是非线性的 ,用传统的线性信号处理方法 (如FFT)来模拟人耳基底膜的频率分析特性是比较困难的 .小波包算法有灵活的时频分析能力 ,可较好地符合人耳基底膜的频率分析特性 .在模拟人耳的听觉机理方面 ,用动态阈值法成功地对含噪语音进行了去噪处理 ,在去噪处理中引入音乐噪声的问题也较好地得到解决 .实验表明 :在单声道的条件下 ,其语音增强效果比传统的频谱减法有更高的清晰度和可懂度  相似文献   

14.
今天的语音识别正处于由实验室技术走向实用化,产品化的关键时期,然而,现有的绝大我数语音识别系统在噪声环境中的性能都不可避免地急上降,环境噪声已经成为语音识 技术商品化的一个主要障碍,因此在语音识 技术逐渐走向实用化的过程中,噪声语音识别日益成为一个重要的研究领域,遗憾的是,由于噪声语音识 问题本身的复杂性,至今还没有一种方法可以圆满地解决这一问题,拟从模型补偿方面,对噪声环境下的孤立词语音识别进行一些探索,重点研究一个在噪声环境下的语音识别算法--并行模型组合方法(PMC),详细论述了其原理以及在噪声环境下的语音识别中的应用。实验中,我们使用汉语的数字语音,分别在3种不同噪声不同信噪比条件下对这一方法进行了识别率测试,结果显示,该方法有着令人振奋的识别效果。  相似文献   

15.
语音端点检测是语音识别中非常重要的部分,识别率高低很大程度上取决于端点检测的精确程度。在高信噪比(signal-noise ratio,SNR)的实验室环境下,端点检测有很好的效果;但比如像工厂和市场等低SNR环境下,传统的检测方法性能迅速降低,端点检测无法达到预期效果。针对低SNR语音的端点检测,先通过谱减法对带噪语音进行降噪,再分别求出每帧语音信号的能量与频带方差的乘积,将乘积值作为参数进行双门限端点检测的思路,提出了一种能量和频带方差结合的端点检测方法。将TIMIT数据集中语音叠加高斯随机噪声、NOISEX 92噪声库中的factory噪声和volvo噪声进行实验。结果表明,当SNR在-10 d B时,仍有较好的检测效果,显著提高了语音端点检测的效果。  相似文献   

16.
为提高噪声不平稳或不可估的情况下语音识别的稳健性,提出了利用自回归模型和短时平稳性假设,估计干净与噪声环境的语音数据,建立相应的语音识别模型,以达到抗噪效果的稳健语音信号处理方法。在N o iseX-92的4种噪声环境(w h ite,babb le,vo lvo,destroyer eng ine)从0到20 dB的不同信噪比下的“863”大词汇连续语音标准数据库的平均识别结果表明,该方法能够使得基于段长分布的隐M arkov模型的语音识别系统在25候选时声学层的音节相对错误率下降达到10.85%以下,同时相对正确识别率上升12.13%。  相似文献   

17.
基于CDHMM/SOFMNN噪声背景下的语音识别方法   总被引:2,自引:0,他引:2  
针对噪声背景下传统语音识别系统识别率较低的问题,提出了一种将自组织特征映射神经网络(SOFMNN)与隐马尔可夫模型(HMM)相结合的方法,训练出适应噪声的混合模型.该模型适合于对噪声背景下的语音进行识别.同传统的CDHMM模型以及直接在语音中加入加性噪声训练出的CDHMM模型相比,该模型具有更好的抗噪鲁棒性,在信噪比较低的情况下(2~12 dB),识别率比传统CDHMM模型有明显提高.  相似文献   

18.
为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势.  相似文献   

19.
提出了一种可用于嵌入式ASR系统的语音/噪声分类的新方法,该方法利用一个噪声模型,对每帧信号的评价值进行语音/噪声分类.实验表明,该方法可以有效地区分语音和噪声,并表现出在各种噪声环境和不同信噪比条件下的鲁棒性.该算法已经集成进一个ASR系统,并在Corn-paq iPAQ上进行了测试,其计算代价不到整个系统代价的10%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号