首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
语音增强是语音识别的重要组成部分,它是将尽可能纯净的原始语音从嘈杂的语音中提取出来。其目的是提高语音质量,从而提高语音识别的准确率。笔者在总结近年来的语音增强的相关算法的基础上,将这些算法进行分类,分为基于数字信号处理的方法和机器学习的方法。本文介绍了基于数字信号处理和基于机器学习的语音增强算法,并总结了几种常用语音增强算法的优缺点,最后提出了语音增强算法进一步研究方向。  相似文献   

2.
采用基于子空间的方法,对语音信号进行增强处理,该算法提供了在语音信号失真和残留噪声之间进行控制的机制。克服了以往语音增强算法中对语音信号的噪声特点的限制,可以对混有加性白噪声、有色噪声和音乐噪声的语音信号进行增强处理。  相似文献   

3.
动态阈值谱法语音增强   总被引:2,自引:0,他引:2  
根据人耳能从噪声中提取有用信息的听觉特征,并结合语音信号的基本特征,提出并研究了一个适合于语音增强的听党内模型;实验结果表明,这个方法不仅在提高语音信噪比方面,而且在减小语音失真度方面均有较好的改善。  相似文献   

4.
一种基于小波变换的语音增强新方法   总被引:3,自引:0,他引:3  
根据随机噪声的小波变换系数在不同尺度上的传递特性和噪声信号奇异性与小波模极大值的关系,提出用一个随尺度变化的软阈值来抑制带噪语音信号在不同尺度上的噪声小波系数的语音增强方法.实验结果表明:该方法既能减小语音畸变,又能有效地去除噪声,具有较好的语音增强效果.  相似文献   

5.
本文讨论了运用小波变换实现语音增强的原理,提出了相应的去除噪声的方法。实验表明,本文方法能有效地提高噪声背景下语音识别系统的性能。  相似文献   

6.
针对加性有色噪声干扰,提出了一种单通道输入基于信号子空间的话音增强算法。算法中使用自适应的方法跟踪KLT(Karhunen—Loeve Transform)阵。运用一种近似模型来表述有色噪声的特性,并基于噪声平稳的假设,通过采用预处理技术的语音活动性检测(VAD:Voice Activity Detection)单元获取噪声样本,用于下一语音帧中噪声特性的估计和增强处理。实验表明,算法对于有色噪声干扰下的语音信号有较好的增强效果,并且性能优于改进减谱法。  相似文献   

7.
一种基于形态学的语音增强方法   总被引:2,自引:0,他引:2  
依据数字语音信号的特点,提出了一种用于语音处理的形态学滤波算法.实验结果表明,该方法有效地抑制了噪声的干扰,对混噪语音质量的增强效果显著.由于形态滤波器的性能与结构元素有关,因此考查了结构元素是寸的变化对增强语音信噪比的改善情况.研究表明,结构元素的宽度变化对增强后语音的输出信噪比的影响较大.  相似文献   

8.
鲁棒语音识别技术综述   总被引:1,自引:0,他引:1  
鲁棒语音识别是为了解决噪声环境所引起的语音识别系统识别和训练不匹配的情况.依据噪声对语音识别系统的影响,从信号空间、特征空间及模型空间3个层面上分别对语音增强技术、特征增强技术及语音模型补偿、增强技术进行了总结,并分析了不同方法的特点、实现及应用.  相似文献   

9.
语音增强是语音信号处理领域一种传统且依然非常活跃的研究分支。单通道语音增强是指从单个麦克风采集的带噪语音中尽可能恢复出干净语音,在移动通信、语音交互、数字助听等领域有重要的应用价值。传统的单通道语音增强技术在处理平稳噪声时已取得较好的增强性能,但在非平稳噪声条件下增强效果依然难以令人满意。近年来,随着人工智能的快速发展,基于深度学习的单通道语音增强在处理非平稳噪声问题方面已取得明显的进展。通过系统梳理单通道语音增强中深度学习方法的发展,并按照技术发展脉络,分基于参数映射、基于生成对抗机制和基于弱监督3个方面进行综述,介绍三类方法的基本原理,分析典型文献的技术思路,总结三类方法的优势与存在的问题,最后对深度学习技术在单通道语音增强领域的发展进行了展望。  相似文献   

10.
研究了单话筒采集条件下基于语音短时对数谱的最小均方误差(MMSE—LSA)估计的语音增强算法,给出了其算法分析的基本流程图。由于语音是时变的,因此,假设语音频谱分布为高斯分布,在此基础上讨论了MMSE—LSA算法的先验信噪比ξh的2种估计方法——最大似然估计方法和直接判决估计方法。试验证明此方法的语音增强效果较好,尤其在较低信噪比时效果更明显。  相似文献   

11.
在语音信号处理系统的设计中,信号的相位信息总是没有得到设计者足够的重视。本书第一次提出并反复强调信号相位信息在声源定位、语音识别和语音增强中的重要作用,书中很好地讨论并总结了当前基于相位的语音信号处理的最新进展。  相似文献   

12.
为降低噪声对语音通信的干扰,提出了一种基于谱减的语音增强算法的改进方法。根据噪声频谱的G auss统计模型修正语音增强过程中噪声频谱的估计方法,利用帧内、帧间约束估计每一个频点的先验信噪比,提出了一种简便的估计语音在每一个频点出现的概率的方法,得出了修正的语音增强算法。在白噪声以及坦克噪声环境中分别对算法的性能进行测试。实验结果表明:在几乎不损伤语音清晰度的前提下,该算法使“音乐噪声”得到了更好的抑制,同时信噪比提高了约8 dB以上。  相似文献   

13.
语音增强是解决噪声污染的有效方法,它的首要目标是在接收端尽可能从带噪语音中恢复纯净的语音信号.讨论强背景噪声下的基于模糊系统的语音增强方法,并与减谱法语音增强算法进行比较.计算机仿真结果表明,该方法在大大消除背景噪声的同时,消除了音乐噪声,同时保持语音信号较好的可懂度.  相似文献   

14.
语音在传输过程中受到来自周围环境、传输媒介等的干扰是不可避免的,这些干扰会严重影响语音接收时的质量,导致收到的语音信号不再是原始的纯净语音信号,而是带有各种干扰噪声的语音信号,这不仅影响语音的收听质量,也给后续的语音处理带来了一定的影响.因此对语音进行增强不可或缺.大部分传统的语音增强算法仅仅只通过改变语音的幅度,再叠加上原始的语音相位或者仅调整语音的相位再和未改变的幅度叠加来实现语音信号重建从而增强语音.本文提出了一个通过既改变语音信号的幅度又改变其相位的语音增强算法.通过使用客观语音质量测评(PESQ)和语谱图对用不同方法增强后的语音进行比较,验证了用本文方法得到的增强语音质量更佳.  相似文献   

15.
基于线性预测的自适应语音增强技术   总被引:1,自引:0,他引:1  
提出了一种基于线性预测的自适应语音增强方法。该方法利用带噪语音的线性预测作为自适应滤波器的参考输入,使有色噪声的相关性隐含于参考输入之中,从而大大地提高了语音的信噪比。仿真实验证明.被环境噪声污染了的语音信号经自适应系统处理后,其信噪比提高了32.70dB。  相似文献   

16.
语音增强技术在低速语音编码中的应用   总被引:1,自引:1,他引:0       下载免费PDF全文
在语音编码的应用环境中,特别是在军事应用中,强噪声环境下声码器性能的改进是一个亟待解决的问题。在研究语音增强技术的基础上,将语音增强技术于低速语音编码,有效地改善了低速语音编码算法的抗背景噪声的性能。并利用所构建的语音质量客观评价平台,对语音增强低速编码算法的抗背景噪声性能进行了客观评估与分析。  相似文献   

17.
基于小波变换的传声器阵列语音增强方法   总被引:5,自引:0,他引:5  
针对现有的基于传声器阵列语音增强算法的局限性,并考虑到入耳听觉感知模型,提出一种将延迟-求和波束形成技术和小波变换技术相结合进行语音增强的方法,该方法首先利用延迟-求和波束形成技术将阵列中各个传声器接收到的信号进行时间延迟补偿,并对各通道信号相加-平均,消除一部分不相干或弱相干噪声;然后再利用小波变换技术进一步去除噪声,计算机模拟结果表明,该方法具有良好的消噪能力。  相似文献   

18.
语音增强用于抗噪声语音识别   总被引:12,自引:1,他引:11  
语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能  相似文献   

19.
融合语音增强与后续补偿的抗噪声语音识别方法   总被引:2,自引:1,他引:2  
为了提高基于隐含Markov模型的语音识别系统在噪声环境中的稳健性,研究了一种融合语音增强与后续补偿的抗噪声语音识别方法.在前端,语音增强有效地抑制背景噪声,从而提高了输入信号的信噪比.语音增强后的剩余噪声以及语音失真是对语音识别不利的因素,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿.实验结果表明,此方法能够显著地提高语音识别系统在噪声环境中,特别是低信噪比条件下的识别精度,如对-5 dB的自噪声,该方法可将识别精度从11.7%提高至71.0%.  相似文献   

20.
骨导语音具有天然的抗环境噪声能力,然而,受骨导麦克风佩戴位置和方式的影响,骨导语音在采集过程中常混入骨导麦克风与皮肤或衣服之间的摩擦声,导致现有基于深度学习的骨导语音增强方法鲁棒性不高、适应性不强。为提高骨导语音增强的鲁棒性,提出一种融合数据预滤波和频谱展宽的骨导语音增强方法。该方法首先通过低通滤波对骨导语音数据进行预处理以去除高频噪声,然后对预滤波后的骨导语音进行时频变换,并分别基于U Net和CRNN两种深度网络进行频谱展宽,最后通过时频逆变换重构出全频带语音。仿真结果表明,与现有深度网络增强方法相比,所提方法可以取得更好的PESQ和STOI客观评价指标,主观听感具有更好的清晰度,且对不同说话人具有更好的适应性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号