首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 312 毫秒
1.
为改进传统贝叶斯非负矩阵分解(BNMF)语音增强算法的性能,提出基于高斯混合模型的贝叶斯非负矩阵分解语音增强算法。该算法分为训练和增强两个阶段,训练阶段,对纯净语音与噪声分别进行训练,得到纯净语音字典、噪声字典与联合字典;增强阶段,采用最小均方误差法(MMSE)从带噪语音中重构原始干净的语音,达到语音增强的目的。实验表明,该算法在提高语音质量和抑制背景噪声等方面,均优于非负矩阵语音分解(NMF)算法与BNMF算法。  相似文献   

2.
在鲁棒主成分分析中引入非负矩阵分解学习得到非负语音字典,提出了一种非负字典训练和鲁棒主成分分析相结合的非监督单通道语音增强算法.算法采用交替方向乘子计算优化解.采用客观感知语音质量评估方法(PESQ)对增强效果进行评估.评估中采用了TIMIT标准语音和20多种噪声在不同信噪比下进行混合得到的带噪语音信号.评估结果表明:本文提出的方法优于典型的非负矩阵分解方法和鲁棒主成分方法.  相似文献   

3.
张开生  赵小芬  王泽  宋帆 《科学技术与工程》2020,20(35):14536-14542
针对复杂环境下语音端点检测准确率低下且检测耗时过长的问题,研究一种基于EEMD和OS-DL联合去噪的语音端点检测算法。首先利用EEMD(总体平均经验模态分解)算法对输入语音进行分解得到IMF(本征模式分量),然后使用OS-DL(一步式字典)算法分别对纯净语音信号与噪声信号进行训练,得到纯净语音信号和噪声信号的幅度谱字典,进而对幅度谱进行稀疏表示,利用得到的系数矩阵重新构建出语音信号频谱,将重构出的语音信号频谱经过傅里叶逆变换得到降噪后的语音信号,最后对降噪后的语音信号利用均匀子带频带方差法进行端点检测。实验结果表明:该算法在复杂环境信噪比低于-10dB情况下检测准确率仍可达到85%以上,且平均检测时间缩短至传统端点检测算法的1/3。  相似文献   

4.
该文提出一种总体平均经验模态分解(ensemble empirical mode decomposition,EEMD)方法与K奇异值分解(K-singular value decomposition,K-SVD)字典算法相结合的语音增强算法。将带噪语音通过EEMD分解得到各本征模式分量(intrinsic mode function,IMF),对各IMF分量进行互相关和自相关分析,去除噪声IMF分量,并将过渡IMF分量再次进行EEMD分解,去除其中的噪声IMF分量。将过渡IMF分量和剩余的IMF分量叠加,得到预降噪的带噪语音。利用纯净语音,通过K-SVD字典训练算法得到过完备字典。对预降噪的带噪语音通过过完备字典进行稀疏表示,稀疏系数重构出纯净语音。实验结果表明:在低信噪比和高信噪比情况下,该算法的去噪效果明显优于传统的谱减法、小波阈值去噪法和K-SVD字典训练。  相似文献   

5.
提出一种基于Sparse K-SVD学习字典的语音增强方法,采用Sparse K-SVD算法自适应地训练一个可稀疏表示的冗余字典,在该冗余字典上采用正交匹配追踪(OMP)算法对带噪语音信号进行稀疏分解,利用稀疏系数矩阵重构纯净语音,实现语音增强.使用NOIZEUS语音库进行了一系列的语音增强实验,主客观评测数据表明,基于稀疏表示的语音增强方法(分别使用Sparse K-SVD和K-SVD训练字典)相对于传统语音增强方法(小阈值波法、谱减法、改进谱减法)可进一步改善语音质量;对字典训练时间进行统计,发现Sparse K-SVD算法训练字典消耗的时间为K-SVD算法训练时间的1/6~1/10,大幅度提高了计算效率.  相似文献   

6.
近年来,非负矩阵分解(non-negative matrix factorization,NMF)被广泛应用于单通道语音分离问题。然而,标准的NMF算法假设语音的相邻帧之间是相互独立的,不能表征语音信号的时间连续性信息。为此,该文提出了一种基于NMF和因子条件随机场(factorial conditional random field,FCRF)的语音分离算法,首先将NMF和k均值聚类结合对纯净语音的频谱结构以及时间连续性进行建模,然后利用得到的模型训练FCRF模型,进而对混合语音信号进行分离。结果表明:该算法相比没有考虑语音时间连续特性的基于NMF的算法如激活集牛顿算法(active-set Newton algorithm,ASNA),在客观指标上有明显提高。  相似文献   

7.
为了解决已有语音活动检测方法在噪声条件下性能急剧下降的问题,提出了一种基于稀疏编码的语音活动检测方法.该方法在训练阶段为语音和每种可能的噪声训练字典;在识别阶段首先识别环境噪声类型,然后将语音字典和对应环境噪声字典拼接形成一个大字典用于稀疏分解,最后用语音字典上的稀疏表示实现语音和非语音的判断.该方法一方面引入了噪声类型识别,可以有针对性地选择噪声字典;另一方面引入噪声开集识别机制,能识别新的噪声类型并且为之训练模型.实验结果表明所提方法比传统方法具有更强的噪声鲁棒性.  相似文献   

8.
针对非负矩阵分解算法实现语音增强效果不理想的问题,提出了一种双重约束非负矩阵分解结合改进正交匹配追踪算法的语音增强方法.采用时间约束及稀疏度约束的双重约束方式改进非负矩阵分解算法,使得分解后的数据更能反映出语音特征.通过改进正交匹配追踪算法提升重构精度,并结合语音信号在时频域的分布特征,引入低通滤波器进一步平滑重构后的...  相似文献   

9.
针对不同的语音增强算法对不同噪声的增强效果不同,提出了一种基于深度神经网络的噪声分类的语音增强算法。首先,使用深度神经网络(DNN)算法对噪声进行分类。分类算法包括训练阶段和分类阶段。在训练阶段,采用babble,car,street,train四中噪声对DNN进行训练;在分类阶段,将提取的噪声输入训练好的DNN中,得到分类结果,并对分类性能进行评估。其次,采用PESQ,LSD及SNR等语音评估方法,对不同的含噪语音在不同信噪比、不同语音增强算法下进行评估。语音增强算法包括子空间法、维纳滤波算法、谱减法及对数最小均方误差法(log MMSE),噪声包括babble,car,street,train,信噪比为-5db,0db和5db,并对通过评估得到的值采用平均值法得到噪声和语音增强算法的最佳匹配;最后,针对不同分类噪声,采用不同的增强算法进行语音增强,并对4种噪声之外的噪声根据本文算法选取相应的语音增强算法。  相似文献   

10.
针对传统字典学习算法预处理阶段未考虑图像内外部特征的问题,提出一种基于灰度梯度矩阵的图像熵字典学习算法.该算法通过灰度梯度矩阵计算图像块熵值,并对各图像块进行分类,每类数据组合成训练数据集,再利用基于系数矩阵的奇异值分解算法更新各类子字典.对测试图像的稀疏表示系数进行重建实验,仿真结果表明,该算法可高效训练出自适应稀疏字典,显著提高图像重建精度.   相似文献   

11.
考虑到传统单通道语音增强算法对噪声抑制的局限性,本文采用由两个微型麦克风阵列组成的双微阵列,利用该阵列空间结构的时空域特性对含噪语音进行处理,提出了一种适用于双微阵列的语音增强算法。该增强算法是将各通道采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimunm Mean Square Error,LogMMSE)提升其信噪比,然后利用频域宽带最小方差无畸变响应(MVDR)通过对目标声源信号的获取,保留目标声源方向的信号并抑制其他方向的信号干扰,最后通过一个改进可懂度结合改进最小控制递归平均(Improved Minimum Controlled Recursive Average Algorithm,IMCRA)噪声估计的维纳滤波器来去除噪声残留提升语音质量。仿真实验结果表明,相比传统的单通道语音增强算法,该算法具有良好的噪声抑制性能。  相似文献   

12.
针对说话人识别的噪声鲁棒性问题,在对数谱最小均方差误差估计算法基础上,采用改进的最小值控制递归平均算法对语音帧信噪比进行估计,通过对前一帧的短时功率谱进行2次平滑和前向多帧最小值搜索,结合语音存在概率估计出当前帧的信噪比,并根据信噪比自适应调整增益因子的大小,对噪声进行消除。构建了一种改进的LSA语音增强方法,使用该方法可以使增强后的语音保持较高的自然度。实验结果表明,与MMSE-LSA算法比较,改进的LSA算法具有更好的语音增强效果,在5dB各类噪声环境下,其平均信噪比较MMSE-LSA算法提高1.36dB,主观语音质量评估平均提高8%。将该方法用于说话人识别系统,其检测代价较采用MMSE-LSA算法的系统平均降低3%。  相似文献   

13.
传统的倒谱平滑维纳滤波算法在求取选择性平滑范围时,噪声会对维纳增益函数的倒谱产生影响,使估计出的选择性平滑范围不正确,进而导致此传统算法在平滑掉音乐噪声的同时也影响了噪声抑制效果。为此提出了一种基于修正倒谱平滑技术改进的维纳语音增强算法,该算法先用最大似然准则估计出纯净语音的倒谱,然后在纯净语音倒谱中求取基频和共振峰的位置,进而得到选择性平滑的范围。该方法提高了选择性倒谱平滑的准确性,进而改善了传统倒谱平滑维纳滤波语音增强算法的噪声抑制效果。最后在不同的噪声场景中对传统算法和改进算法进行了仿真对比,表明该算法能够在去除噪声的同时更好地保留语音的特征结构,较好地提高了带噪语音的质量。  相似文献   

14.
描述了先验信噪比估计的维纳滤波算法,分析了小波多分辨率分析在信号频谱划分中的作用,提出一种小波和先验信噪比维纳滤波相结合的改进算法.通过小波变换对带噪语音信号进行多尺度分解,然后对不同尺度的小波系数采用维纳滤波,用滤波后的小波系数重构得到增强语音信号.通过计算机仿真实验,将提出的算法与传统维纳滤波算法进行比较.实验结果表明改进算法在低信噪比情况下有效提高了增强效果,对语音成分的影响较小,提高了语音质量.  相似文献   

15.
为了解决语音分离中非负矩阵分解(non-negative matrix factorization,NMF)、深度神经网络(deep neural network,DNN)等算法没有考虑语音时序相关性的问题。结合NMF和长短时记忆网络(long short-term memory,LSTM)算法提出NMFLSTM单通道语音分离算法:将语音信号的幅度谱作为模型的输入特征,通过训练NMF和LSTM模型获得目标语音的基矩阵和系数矩阵,并对其结果进行语音重构最终实现语音分离。实验结果表明:相比于未考虑语音时间连续性的算法,使用NMFLSTM算法分离语音的客观语音质量评估值(perceptual evaluation of speech quality,PESQ)有明显提升,其最大值超过3. 1,获得良好的分离效果。  相似文献   

16.
针对目前已有的改进相干滤波语音增强系统中噪声互功率谱估计方法运算效率低、准确性不足的问题,提出一种基于软语音存在概率的噪声互功率谱估计方法。通过计算语音信号的固定先验软语音存在概率代替语音活动检测器,得到噪声互功率谱的无偏估计值,以改善估计的准确性,同时还可避免复杂的偏差补偿值计算,使算法计算量得以减小。仿真实验结果表明,所提出的噪声互功率谱估计方法在应用于改进相干滤波语音增强系统时有更好的感知语音质量评价得分,且运算用时更短。  相似文献   

17.
针对谱减法增强语音后残留"音乐噪声"明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法.通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声.仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果.  相似文献   

18.
针对加性有色噪声干扰,提出了一种单通道输入基于信号子空间的话音增强算法。算法中使用自适应的方法跟踪KLT(Karhunen—Loeve Transform)阵。运用一种近似模型来表述有色噪声的特性,并基于噪声平稳的假设,通过采用预处理技术的语音活动性检测(VAD:Voice Activity Detection)单元获取噪声样本,用于下一语音帧中噪声特性的估计和增强处理。实验表明,算法对于有色噪声干扰下的语音信号有较好的增强效果,并且性能优于改进减谱法。  相似文献   

19.
基于CASA简化模型的语音增强算法   总被引:2,自引:0,他引:2  
基于听觉现象分析(CASA)模型的基本原理,针对仅有非语音信号干扰情况下的单通道语音增强处理问题,利用人耳的频率掩蔽效应,提出了一种单通道简化CASA计算模型语音增强新算法,新算法通过提取混合语音输入中的有效语音时频成分并利用人耳的听觉掩蔽效应重构合成增强语音输出信号,通过在汽车噪声和白噪声干扰下的仿真实验结果表明,简化的CASA模型语音增强算法的输出信噪比约提高了10dB,且可以有效抑制干扰噪声的听觉影响,增强输出语音信号的可懂度。  相似文献   

20.
针对单通道语音增强问题,基于计算听觉场景分析(CASA)的原理,提出了一种基于CASA计算模型的语音增强改进算法。该算法在特征提取中选择了目标语音有效能量、信道互相关等特征,对语谱能量和互相关特征的阈值选取进行了改进。在5种低信噪比噪声干扰条件下的仿真实验结果证明,该算法输出增强语音的信噪比平均提高了9.32dB,有效地抑制了噪声。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号