首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对在弱语音信号和低输入信噪比(SNR)情况下,基于短时谱估计的语音增强算法性能下降的问题,提出了一种结合软判决信息和人耳听觉掩蔽效应的短时谱估计算法。该算法在最小均方误差准则下引入语音存在的概率,得到软判决修正的增益函数,然后利用掩蔽门限不断地调整增益函数,进而调整噪声的抑制程度,保护微弱的语音信号,减少语音谱的失真。客观测试和主观试听表明,该算法在信噪比增益以及语音的可懂度、自然度方面都优于传统的最小均方误差估计算法。  相似文献   

2.
在复杂声音场景,尤其是多人对话交谈的情况中,人工耳蜗佩戴者的言语可懂度会显著下降。该文提出了一种基于近距离双麦克风的语音增强算法,通过提取采集信号的延迟参数,并根据该参数设置掩蔽矩阵,进而区分不同方位的声源,抑制竞争性语音噪声。同时还以数字信号处理器(digital signal processor, DSP)为核心,搭建调试平台,对算法进行了工程实现。实际测试表明,算法提升了前端信号的信噪比,鲁棒性强,并且算法单帧运行时间短,可以和常用的人工耳蜗言语编码策略相融合,满足人工耳蜗的实时计算需求。  相似文献   

3.
通过分析含噪语音信号的特点,引入能够兼顾人耳听觉特性的听觉感知小波变换,构造了新的小波阈值函数,并对小波变换分解后的阈值进行基于微粒群算法的分层优化.仿真实验表明,该方法在不同信噪比条件下均具有较好的去噪性能,语音的可懂度和听觉效果得到有效提高.  相似文献   

4.
针对现有语音增强算法在低信噪比(SNR)非平稳噪声环境下的表现并不理想这一问题,提出了一种基于深度学习的语音增强算法.首先,构建了一个深度神经网络(DNN),然后从四个不同分辨率的耳蜗中提取了多分辨率听觉倒谱系数(MRACC)作为神经网络的输入,该系数既关注了细节的高分辨率特征,又把握了全局性的低分辨率特征;其次,跟踪噪声变化构建了一个自适应掩蔽阈值(AM)作为神经网络的训练目标,该阈值能够依据噪声调节理想二值掩蔽(IBM)和理想软掩蔽(IRM)的权重;最后,将估计的自适应掩蔽阈值用于对含噪语音进行增强.实验结果表明:相较于对比算法,该算法不仅可以进一步提高语音质量和可懂度,而且能够抑制更多的噪声.  相似文献   

5.
实际环境中,语音总会受到外界噪声不同程度的干扰和影响.文章采用TMS320VC5416 DSP和TLV320AIC23 Codec组成实时系统,实时实现了基于卡尔曼滤波的谱减法的实时语音增强系统,能够实时、有效地提高语音信噪比,增强语音可懂度,改善语音质量.  相似文献   

6.
基于CASA简化模型的语音增强算法   总被引:2,自引:0,他引:2  
基于听觉现象分析(CASA)模型的基本原理,针对仅有非语音信号干扰情况下的单通道语音增强处理问题,利用人耳的频率掩蔽效应,提出了一种单通道简化CASA计算模型语音增强新算法,新算法通过提取混合语音输入中的有效语音时频成分并利用人耳的听觉掩蔽效应重构合成增强语音输出信号,通过在汽车噪声和白噪声干扰下的仿真实验结果表明,简化的CASA模型语音增强算法的输出信噪比约提高了10dB,且可以有效抑制干扰噪声的听觉影响,增强输出语音信号的可懂度。  相似文献   

7.
首先指出固定窗长的窗函数在处理复杂语音信号时,通常会遇到保持短时平稳性和准确性的矛盾.继而提出一种窗长可以自适应的算法来解决问题,在维持短时平稳性的同时保证准确性.实验结果表明,通过窗函数的窗长自适应来响应复杂信号的频率变化,能够更准确、更有效地处理语音信号.  相似文献   

8.
提出一种基于基频状态和帧间相关性的单通道混合语音分离算法.首先,从混合语音中提取2个源语音的基频进行状态编码,基于编码的基频状态构造自适应字典,并通过引入基频信息在字典层面对各源语音信号进行区分.然后,采用频繁模式挖掘算法,提取基频状态为1时字典的频繁1项子集,缩减字典尺寸.最后,以基于正交匹配追踪的分离语音为基础,检测分离效果差的混合语音帧,搜索与其相关度最高的平移后的邻近分离语音帧进行叠加,并采用软掩蔽方法进行第二次分离校正.仿真实验结果表明,该算法获取的分离语音信噪比优于现有的2种经典语音分离算法,并且该算法采用频繁模式挖掘算法大大减小了运算量.  相似文献   

9.
针对传统子空间语音增强方法中,由于不能去除整个噪声子空间而导致语音特征值估计的偏差,致使增强语音中仍有残留噪声的问题,提出一种新的用小波包改进的方法,该方法利用小波包对噪声的抑制功能,首先对带噪语音进行KL(Karhunen-Loeve Transform)变换,得到带噪语音的特征值,并对该特征值进行Daubechies8小波尺度分解,利用新的改进的软判决阈值函数去除一部分噪声子空间;然后再在子空间内用统计信息的方法实时跟踪此时噪声特征值,进一步消除所有噪声子空间,从而得到最终估计的语音特征值;最后由KL逆变换还原出纯净语音。仿真结果表明,在输入信噪比相同的情况下,经过该方法的增强语音的输出信噪比明显高于传统子空间方法,听觉感受上增强语音也具有更好的清晰度和可懂度。  相似文献   

10.
对于在噪声背景下的深度学习来说,好的特征提取能极大地提高语言增强的性能.研究在深度信念网络中,以目前性能最好的理想浮值掩蔽为学习目标,验证Gammatone域特征的语音增强效果优于其他域特征.首先,分别提取在不同噪声不同信噪比下的基于Gammatone域的语音特征,根据纯净语音和噪声计算得到初始理想浮值掩蔽;其次,采用深度信念网络作为学习模型,从训练带噪语音特征中学习得到估计的理想浮值掩蔽;最后,利用测试语音特征和估计的理想浮值掩蔽合成增强语音,分析所用特征的有效性.实验结果表明:基于Gammatone域的语音特征比其他域特征的各种性能评价指标值更高,明显提高了语音质量,增强效果更佳.  相似文献   

11.
针对近讲系统的声学场景,提出一种基于听感知特性的双麦克风语音增强算法。模拟人耳频率分解特性,用gammatone滤波器组对2路麦克风采集的声音信号进行多子带频率分解;对分解后的时域信号进行分帧,生成时频单元,并计算每个时频单元的能量;以2路信号时频单元能量比值为线索,估计每个时频单元信噪比,模拟人耳掩蔽特性生成掩蔽模板,并作用于带噪声的语音信号,实现目标语音与环境噪声的分离。实验结果表明:由2路麦克风信号时频单元能量的比值可较准确估计时频单元的信噪比;该算法可提高带babble噪声命令词的识别正确率,优于当前单通道及双通道语音增强算法。  相似文献   

12.
基于计算听觉场景分析,对基于能量的二值掩蔽语音分离算法的性能进行分析,证明了理想二值掩蔽算法在信噪比下具有最佳的单元分离性能,并通过3种类型带噪语音的分离实验证实了该结论。采用理想二值掩蔽算法对8种噪声类型的低信噪比带噪语音进行了分离实验,信噪比平均提升幅度大于10dB,表明算法对低信噪比语音分离的有效性和普遍适用性;采用非均匀、均匀两种多子带分析滤波器组进行分离性能对比测试,结果表明子带均匀性对信噪比提升影响不大。分析滤波器组的子带数量应大于32以实现较好的分离性能。  相似文献   

13.
针对近讲场景,提出一种双麦克近讲语音增强算法。该算法基于耳间延时差(ITD)、耳间强度差(IID)特征来区分目标语音,利用声学掩蔽效应,实现目标语音对背景噪声的分离降噪。与传统的单麦克增强方法相比,该算法可消除多种类型噪声且对语音造成的损伤较小。实验表明:该算法能将8~33dB的白噪声、音乐噪声、广播噪声3种噪声类型的带噪语音的信噪比提高到36dB以上,同时保持较高的目标语音可懂度。对于冲击噪声的带噪语音也具有较好的降噪效果。  相似文献   

14.
先验信噪比估计精度直接影响着语音增强算法的性能.本文对3种不同的先验信噪比估计算法:经典的直接判决算法、两步噪声消除算法和改进型直接判决算法的优缺点进行了理论分析和实验验证.实验部分包括:语谱、输出先验信噪比跟踪曲线、不同背景噪声下的输出对数似然比图像、不同背景噪声下输出的分段信噪比图像和不同噪声下输出的短时客观可懂度图像.此外,分析了直接判决算法的平滑因子的取值对音乐噪声和语音失真的影响.  相似文献   

15.
多通道语音增强能提高语音质量、言语可懂度及言语识别率。然而,现有方法需要假定所需语音入射角度必须为0°。为了克服对入射角的限制,该文提出了一种新的自适应双通道语音增强算法。首先,声源通过由分数阶延时滤波器构成的双通道陷零波束形成器,信号被分成前、后半平面2个部分;再经过调制频谱识别,信号被进一步分成语音与非语音成分;最后,语音成分作为自适应滤波器的输入,非语音成分作为噪声参考输入,经过自适应滤波,从而实现语音增强。实验结果表明:当所需语音的入射角不是0°时,本文算法能不失真地恢复纯音和语音的时频信息,有效抑制噪声干扰。与此同时,该文算法收敛速度快,受步长的影响小。因此,该文算法能更好地符合实际声场的要求,能有效地增强语音。  相似文献   

16.
利用语音在DCT域的稀疏性,提出了一种基于语音分为清音和浊音的特点,自适应分配观测点数的语音重构方法.首先根据清浊音在整个语音段占有的能量比分配观测点,然后判断每帧语音性质.如果是清音,则根据能零比的大小来分配该帧的观测点数;如果是浊音,则根据能量的大小来分配观测点数.实验表明:语音信号是稀疏的并且可压缩,在同种压缩比下,文中所采用的语音重构算法具有较好的信噪比、误差以及MOS分.  相似文献   

17.
为提高低信噪比下语音端点检测的准确性,提出了一种基于模糊熵与改进相关向量机的端点检测算法.首先对语音信号进行基于听觉感知特性的语音增强,然后提取每帧信号的模糊熵作为改进相关向量机的输入矢量,同时针对单一核函数对预测分类鲁棒性弱的问题,对不同核函数进行自适应多核组合,融合多个核函数的特性,提高分类精度和鲁棒性.实验结果表明:在低信噪比环境下,基于模糊熵与改进相关向量机的端点检测能更有效地检测出语音的端点,准确率达到93.2%.  相似文献   

18.
广义旁瓣抵消器自适应波束形成算法对受固定干扰源影响的目标语音有良好的消噪效果,但在自适应抵消模块不可避免地存在语音泄漏,使目标语音受到一定损失,且残留部分背景噪声.文中先对传统的GSC结构自适应波束形成算法进行研究,分析语音泄漏的原因,并提出一种多通道语音补偿方法对GSC结构消噪后的语音进行补偿.对不同频段的噪声帧和语音帧做针对性处理,同时在对语音进行分割时保护共振峰,防止其发生偏移和变形,仿真实验与测试结果表明,该方法可以有效地补偿语音泄漏,消除残留噪声,提高语音可懂度.  相似文献   

19.
基于HMM的孤立字识别   总被引:1,自引:0,他引:1  
本文以HMM(隐马尔可夫模型)为基础研究孤立字的汉语语音识别。孤立字的汉语语音样本首先经过人工切分去除寂静段,然后进行分帧处理;对每一帧语音进行频域预加重和时域汉明窗加权处理后,提取该帧的39维的MFCC混合参数(Mel频率倒谱参数);把该字所有帧的MFCC混合参数作为该字HMM模型的观察序列对其进行训练。通过在小人群范围内对0-9这十个孤立数码语音的大量实验,得到了很好的识别效果。  相似文献   

20.
大多数去混响的算法都是基于短时分析,不可避免地带来了截断效应;如果对混响语音进行逆滤波,则要求房间冲激响应满足最小相位.本文提出了一种针对单通道的语音长时分帧的去混响算法.算法采用长时帧分析,有效减小了截断效应的影响.首先对混响语音信号进行长时分帧计算其最小相位分量倒谱,然后根据纯净语音和房间冲激响应倒谱的不同分布,在倒谱域阻带滤波得到去混响语音最小相位分量的估计,根据最小相位倒谱理论,进而可以估计出去混响语音频域的模,最后利用人耳对相位信息的不敏感性,用估计的去混响语音的模和混响语音的相位合成,傅里叶反变换得到去混响语音时域波形.实验表明,该算法有良好的去混响效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号