首页 | 本学科首页   官方微博 | 高级检索  
     

基于深度学习的听觉倒谱系数语音增强算法
引用本文:李如玮,孙晓月,刘亚楠,李涛. 基于深度学习的听觉倒谱系数语音增强算法[J]. 华中科技大学学报(自然科学版), 2019, 47(9): 78-83
作者姓名:李如玮  孙晓月  刘亚楠  李涛
作者单位:北京工业大学信息学部信息与通信工程学院,北京,100124;北京工业大学信息学部信息与通信工程学院,北京,100124;北京工业大学信息学部信息与通信工程学院,北京,100124;北京工业大学信息学部信息与通信工程学院,北京,100124
基金项目:北京市教委科技面上项目;国家自然科学基金
摘    要:针对现有语音增强算法在低信噪比(SNR)非平稳噪声环境下的表现并不理想这一问题,提出了一种基于深度学习的语音增强算法.首先,构建了一个深度神经网络(DNN),然后从四个不同分辨率的耳蜗中提取了多分辨率听觉倒谱系数(MRACC)作为神经网络的输入,该系数既关注了细节的高分辨率特征,又把握了全局性的低分辨率特征;其次,跟踪噪声变化构建了一个自适应掩蔽阈值(AM)作为神经网络的训练目标,该阈值能够依据噪声调节理想二值掩蔽(IBM)和理想软掩蔽(IRM)的权重;最后,将估计的自适应掩蔽阈值用于对含噪语音进行增强.实验结果表明:相较于对比算法,该算法不仅可以进一步提高语音质量和可懂度,而且能够抑制更多的噪声.

关 键 词:语音增强  深度神经网络  听觉倒谱系数  自适应掩蔽阈值  低信噪比  噪声跟踪

Speech enhancement based on auditory cepstral coefficient with deep learning
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号