首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
[目的]针对基于深度神经网络频谱估计的麦克风阵列算法存在数据依赖的问题,提出了一种基于深度学习的混响感知麦克风阵列语音增强算法.[方法]首先利用麦克风阵列波束形成输出与原始信号做互相关,以近似房间冲激响应的形式获取当前环境的混响特性作为LSTM网络的输入,网络模型以干净语音为目标进行训练从而输出房间冲激响应泛化向量,最后通过组合近似房间冲激响应与房间冲激响应泛化向量获得后置抗混响滤波器系数,实现语音增强.[结果]仿真和实验结果中,与波束形成、加权预测误差算法和传统深度学习去混响算法相比,所提出的方法在不同混响场景下具有更好的表现.[结论]本文方法在不同混响场景下都具有相对稳定的抗混响能力,具有较好的泛化性能.  相似文献   

2.
提出了一种新的基于偏微分方程的形态学腐蚀算子,该算子能够直接对梯度图像进行噪声抑制和边缘增强,在异质扩散系数的求取过程中,摈弃了传统的在低分辨率条件下计算图像梯度的方法,而是直接利用该算子对梯度图像进行噪声抑制和边缘增强.与基于高斯光滑以及传统的形态学预滤波方法相比,新的扩散系数具有更好的边缘定位能力和对噪声的鲁棒性.实验结果表明基于该算子的异质扩散滤波新方法具有更好的图像光滑和细节保持性能.  相似文献   

3.
为了进一步提高基于深度神经网络的语音增强方法的性能,针对单独使用卷积神经网络难以对含噪语音中的长期依赖关系进行建模的问题,提出一种基于卷积门控循环神经网络的语音增强方法.该方法首先采用卷积神经网络提取含噪语音中的局部特征,然后采用门控循环神经网络将含噪语音中不同时间段的局部特征进行关联,通过结合两种网络的不同特性,在语音增强中更好地利用含噪语音中的上下文信息.实验结果表明:该方法能够有效提高未知噪声条件下的语音增强性能,增强后的语音具有更好的语音质量和可懂度.  相似文献   

4.
在音频/视频会议、人机交互、语音识别等领域,严重的混响干扰导致麦克风阵列语音处理性能急剧下降.针对现有逆滤波等抗混响方法需要获得准确的房间传输响应,而波束形成方法抗混响性能有限的问题,基于广义旁瓣抵消器(generalized sidelobe canceller,GSC)结构提出一种采用旁瓣增强的麦克风阵列抗混响算法(Sidelobeenhanceing reverberation mitigation algorithm for microphone array,SERM).该算法首先进行波束形成,初步获得增强的直达语音信号,并对旁瓣获取的混响分量进行自适应迭代增强,再将旁瓣迭代增强的误差信号作为参考噪声进行自适应噪声抵消,最终输出抗混响语音.实验结果表明,在混响环境下该方法能有效改善麦克风阵列的语音信号质量.  相似文献   

5.
语音增强是语音信号处理领域一种传统且依然非常活跃的研究分支。单通道语音增强是指从单个麦克风采集的带噪语音中尽可能恢复出干净语音,在移动通信、语音交互、数字助听等领域有重要的应用价值。传统的单通道语音增强技术在处理平稳噪声时已取得较好的增强性能,但在非平稳噪声条件下增强效果依然难以令人满意。近年来,随着人工智能的快速发展,基于深度学习的单通道语音增强在处理非平稳噪声问题方面已取得明显的进展。通过系统梳理单通道语音增强中深度学习方法的发展,并按照技术发展脉络,分基于参数映射、基于生成对抗机制和基于弱监督3个方面进行综述,介绍三类方法的基本原理,分析典型文献的技术思路,总结三类方法的优势与存在的问题,最后对深度学习技术在单通道语音增强领域的发展进行了展望。  相似文献   

6.
针对现有机器人基于深度网络的地形识别方法准确率低、网络训练时间长且需要大量训练数据的问题,提出一种基于深度残差网络与迁移学习的地形识别方法。首先,基于Resnet网络构建一种深度残差网络;其次,利用现有Imagenet大型数据集对构建的深度残差网络进行预训练,作为预训练网络,保留预训练网络除全连接层的训练权重,实现预训练网络大规模的参数迁移;最后,利用自建地形图像数据集对深度残差网络的全连接层进行训练,实现深度残差网络微调。实验结果表明,通过迁移学习的方法,利用深度残差网络对石子路、水泥路、砖地、沥青、草地、泥地6种自建地形图像进行分类,平均准确率达到了99.3%,同时网络训练时间也显著降低。  相似文献   

7.
针对分布式麦克风网络中的说话人跟踪问题,提出一种自适应交互式多模型粒子滤波算法,以实现复杂环境下对说话人的分布式跟踪.首先,对分布式麦克风网络中的说话人跟踪问题建立状态空间模型,并利用贝叶斯滤波理论求解该问题.然后,将交互式多模型与粒子滤波相结合,提出一种双粒子滤波方法对运动模型的转换概率进行自适应估计,以更好地对多种运动模式的说话人进行跟踪.最后,应用一致性算法对分布式麦克风网络中各节点说话人位置矢量的后验分布进行最优融合,从而可能得到全局的最优估计结果.该算法不要求状态空间模型中运动模型转换概率已知,相比传统IM M PF算法对声源复杂运动具有更好的鲁棒性.仿真实验结果验证了该算法的有效性.  相似文献   

8.
基于交叉熵顺序统计滤波的语音端点检测算法   总被引:2,自引:0,他引:2  
为提高语音端点检测在强噪声环境下的准确率,提出了一种基于交叉熵顺序统计滤波(OSF)的语音端点检测算法。该算法以子带交叉熵为语音/非语音的区分特征,首先将每帧语音的频谱划分成若干个子带,估计出每个子带能量与背景噪声之间的交叉熵,然后把相继若干帧的子带能量交叉熵经过一组顺序统计滤波器,最后根据各帧交叉熵的值对输入的语音进行分类。实验结果表明:该算法能够有效地区分语音和非语音。特别是在强噪声环境下依然能够保持很高的检测率,具有鲁棒性。通过实验结果比较,该算法在性能上优于最近提出的基于能量顺序统计滤波和单纯交叉熵判别的两种方法。  相似文献   

9.
针对小体积应用场合下的语音增强,提出了一种基于等边三角形结构的麦克风阵列与Wiener后置滤波相结合,并由VAD作为控制单元的语音增强方法。该方法克服了自适应零限波束形成只能抑制空间相干噪声的缺点,并得到可在二维平面上旋转的波束主瓣。通过仿真和真实环境的实验,证明算法能够显著地提高输入语音信噪比,且适用于多种噪声场。  相似文献   

10.
针对非线性说话人跟踪系统,提出一种基于自适应有限差分粒子滤波算法的麦克风阵列声源定位与跟踪方法.该方法在改进的粒子滤波框架内,采用适应性较强的布朗运动模型,通过计算麦克风阵列波束形成器的输出能量来构建似然函数,有效降低观测误差的不确定性对说话人位置估计的影响,一定程度上提升了说话人跟踪系统的精度.实验结果表明,该方法在基于麦克风阵列的说话人跟踪系统中具有较高的精确性.  相似文献   

11.
单通道语音增强算法自上个世纪60年代已来有了长足的发展,但由于时频域处理的局限性,目前现有的单通道语音增强算法无法有效抑制背景噪声中的突发噪声成分。突发噪声通常表现为短时、能量强、时频域有纹理特征的噪声,在参数上无法和语音进行有效区分。但对于背景噪声中的突发噪声,其在空间上通常是具有方向性。因此,本文提出了一种联合空间和时频域的语音增强系统。即在语音采集的前端使用GSC麦克风阵列形成波束,使主瓣对准期望语音信号、旁瓣对准突发噪声从而从空间上抑制突发噪声,然后对采集到的语音信号进行时频域语音增强处理。本文选取MMSE-LSA作为时频域的处理算法,因其在保留语音的可懂度、自然度方面有突出的性能。实验表明,该系统可以有效地抑制含有突发噪声的背景噪声。  相似文献   

12.
针对目前已有的改进相干滤波语音增强系统中噪声互功率谱估计方法运算效率低、准确性不足的问题,提出一种基于软语音存在概率的噪声互功率谱估计方法。通过计算语音信号的固定先验软语音存在概率代替语音活动检测器,得到噪声互功率谱的无偏估计值,以改善估计的准确性,同时还可避免复杂的偏差补偿值计算,使算法计算量得以减小。仿真实验结果表明,所提出的噪声互功率谱估计方法在应用于改进相干滤波语音增强系统时有更好的感知语音质量评价得分,且运算用时更短。  相似文献   

13.
针对谱减法增强语音后残留"音乐噪声"明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法.通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声.仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果.  相似文献   

14.
考虑到传统单通道语音增强算法对噪声抑制的局限性,本文采用由两个微型麦克风阵列组成的双微阵列,利用该阵列空间结构的时空域特性对含噪语音进行处理,提出了一种适用于双微阵列的语音增强算法。该增强算法是将各通道采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimunm Mean Square Error,LogMMSE)提升其信噪比,然后利用频域宽带最小方差无畸变响应(MVDR)通过对目标声源信号的获取,保留目标声源方向的信号并抑制其他方向的信号干扰,最后通过一个改进可懂度结合改进最小控制递归平均(Improved Minimum Controlled Recursive Average Algorithm,IMCRA)噪声估计的维纳滤波器来去除噪声残留提升语音质量。仿真实验结果表明,相比传统的单通道语音增强算法,该算法具有良好的噪声抑制性能。  相似文献   

15.
自适应小波阈值语音增强新方法   总被引:1,自引:0,他引:1  
针对单一小波闻值语音增强方法降低语音可懂度这一问题,提出一种基于自适应小波闻值的语音增强新方法.根据噪声帧频谱的平整度判断出噪声的类型,即是白噪声(合频响曲线比较平整的有色噪声)还是频响曲线不平整的有色噪声.由于不同类型的噪声具有不同性质的Lipschitz指数,对两种不同的噪声类型分别采用不同的自适应小波阚值对带噪语音信号进行增强处理.用计算机仿真和实际环境录制的语音数据对该方法的性能进行了测试,实验结果表明在两种实验数据情况下,该方法均具有较好的噪声抑制能力.  相似文献   

16.
针对在非平稳和多种噪声并存的语音增强算法抑制噪声能力有限的问题,提出基于最小跟踪噪声功率谱估计的相干滤波与广义旁瓣抵消的麦克风小阵语音增强算法。该方法先利用最小跟踪噪声功率谱估计的相干滤波抑制弱相关噪声,再结合广义旁瓣抵消与端点检测抑制强相关噪声。实验结果表明,方法更加有效地抑制噪声的影响;并提高了语音的可懂度。  相似文献   

17.
S变换结合了短时傅里叶变换和小波变换的优点,是非平稳信号时频分析的有力工具.为了提高S变换在应用中的实用性和灵活性,该文将S变换改造成时频分辨率可调的广义S变换.广义S变换具有多分辨率特性,利用其高质量的时频分布,在时频域中设计了两种时频滤波器.前者用来实现非平稳信号中特定信号分量的提取,也可滤除处于特定时频平面中的噪声;后者直接应用广义S变换的时频谱实现,用于含高斯白噪声信号的滤波,达到了突出有效信号和压制噪声的效果.几种信号模型的仿真试验显示了它们在信号提取和抑制噪声中应用的有效性.  相似文献   

18.
联合波束形成与谱减法的麦克风阵列语音增强算法   总被引:1,自引:0,他引:1  
考虑到封闭环境的散射噪声场中,传统波束形成方法及单通道谱减法对噪声抑制的局限性,提出一种将波束形成方法与谱减法相结合的麦克风阵列语音增强方法.该方法首先通过波束形成器的空间滤波作用,将波达方向不同的语音信号和噪声信号加以区别,再经过延时补偿单元的相应处理,从而达到衰减噪声的目的,然后采用谱减法对波束形成器输出端的残留噪声进行后置处理.仿真实验结果表明。在小房间混响情况下,与其他方法相比,该方法不仅运算量小。而且具有良好的噪声抑制性能.  相似文献   

19.
提出一种将改进EMD与麦克风阵列MVDR自适应波束形成相结合的语音增强方法。该方法利用互相关系数阈值法去除将EMD算法分解后的的虚假IMF分量,结合各阶IMF分量的自相关函数特性准确获取信号与噪声的主导IMF分量分界点,然后对所有噪声主导的IMF分量进行小波阈值去噪,接着将所有剩余IMF分量进行MVDR波束形成获得增强语音信号。改进EMD算法避免了在高信噪比条件下的信号失真,与MVDR波束形成相结合,满足了MVDR窄带特性要求,增强了麦克风阵列抗干扰能力。实验结果证明了方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号